1 分•作者: PaulHoule•7 个月前
返回首页
最新
1 分•作者: robenkleene•7 个月前
2 分•作者: Velocifyer•7 个月前
1 分•作者: G_S•7 个月前
Hi HN,
我与马赛克艺术家 Françoise Lombaers 合作,她花了二十年时间修复文物,一起探索了当算法与传统工艺限制相遇时会发生什么。
我们一直在思考,当尝试在传统马赛克的限制下实现算法时会发生什么:仅限正方形瓷砖,永不切割。这并不是要让马赛克看起来“数字化”,而是要找到算法逻辑和工艺限制的交汇点。
我们翻译了四种不同的过程:
* 菌丝网络(真菌生长模式)
* Prim-Jarník 算法(最小生成树)
* 康威生命游戏
* 波传播
过程视频:<a href="https://vimeo.com/1106384939" rel="nofollow">https://vimeo.com/1106384939</a>
单独的 Prim-Jarník 作品:<a href="https://guillaumeslizewicz.com/studio/tesselles/" rel="nofollow">https://guillaumeslizewicz.com/studio/tesselles/</a>
我是一名设计师,而不是计算机科学家,所以这主要是关于理解和驾驭算法,然后看看它们在嵌入到马赛克瓷砖中时会变成什么样子。
2 分•作者: reuven•7 个月前
2 分•作者: JonasWiebe•7 个月前
自8月以来,我一直在运行一个评分系统,用于追踪和排名 arXiv 上发表的每一篇新的与人工智能相关的论文。
目标是检测真正的研究进展,即推动该领域发展的成果,并过滤掉通常的噪音和未经证实的上传内容。
每篇论文都通过一个评分算法进行评估。然后,系统存储带有结构化字段的嵌入,如问题、方法、解决方案和结果,以供日后检索。
搜索在一个混合模型上运行:它结合了语义嵌入和元数据,如标题、主题、作者和提取的关键词。查询会返回与给定概念最相关且技术上最有意义的论文。
到目前为止,(自8月以来的)数据看起来很稳定,并且评分与专家策划的列表出奇地一致。所有这些都通过一个免费的 Web 界面和 API 提供。
这对于日常使用有用吗?
1 分•作者: samtheDamned•7 个月前
1 分•作者: groseje•7 个月前
68 分•作者: SG-•7 个月前
2 分•作者: nickplee•7 个月前
嗨,HN,
我是一名钢琴家,一直痴迷于理解伟大的演奏者是如何思考和声的。他们使用了哪些和弦配置?他们是如何进行和弦连接的?他们的双手下到底发生了什么?
早在 2022 年,我就构建了 Harmonic Analyzer(<a href="https://www.youtube.com/watch?v=iNgSgvUmiOs" rel="nofollow">https://www.youtube.com/watch?v=iNgSgvUmiOs</a>)——一款使用机器学习转录复调钢琴录音的 Mac 应用程序。它获得了一些关注,但我从未完全完成它。要求用户下载 Mac 应用程序感觉带来了不必要的阻力,而且我不想将分发限制在 Mac 用户身上。
我刚刚发布了 Pianolyze(<a href="https://pianolyze.com" rel="nofollow">https://pianolyze.com</a>),这是一个完全重写的版本,完全在浏览器中运行。
技术栈:
* ONNX Runtime 托管 Bytedance 的钢琴转录模型(<a href="https://github.com/qiuqiangkong/piano_transcription_inference" rel="nofollow">https://github.com/qiuqiangkong/piano_transcription_inferenc...</a>)
* Web Workers 用于异步转录,通过 Comlink 暴露
* WebGL 用于钢琴卷帘窗渲染
* Web Audio API 用于播放
* IndexedDB 用于模型缓存
* React + MobX State Tree
任何数据都不会离开你的设备。没有服务器,没有上传,没有推理成本。
试用一下:只需拖放任何独奏钢琴录音(MP3、WAV、FLAC、M4A)。模型下载一次(约 100MB),然后一切都在本地运行。它最适合独奏录音;伴奏可能会混淆模型。在桌面上,Chrome 和 Safari 效果最佳。
我很乐意收到关于用户体验、不同硬件上的性能以及它处理各种录音效果的反馈。也欢迎讨论技术方法。
它正在运行,转录伟大的 Mulgrew Miller 的演奏:<a href="https://www.youtube.com/watch?v=sWW-Z9_n8Mk" rel="nofollow">https://www.youtube.com/watch?v=sWW-Z9_n8Mk</a>
2 分•作者: thalissonvs•7 个月前
作者在此。pydoll 是我尝试从头开始构建一个基于 asyncio 的现代化 Python 自动化库。我的主要目标是基于混乱的 Chrome DevTools 协议,创建一个 100% 类型安全的 API。<p>这是一项巨大的工程,涉及将整个协议映射到 Python TypedDicts,这为用户提供了对每个命令和事件的完整 IDE 自动补全功能。我在这里写了关于这种类型安全架构的文章:<a href="https://pydoll.tech/docs/deep-dive/fundamentals/typing-system/" rel="nofollow">https://pydoll.tech/docs/deep-dive/fundamentals/typing-syste...</a><p>这种设计对于构建高级规避功能是必要的。为此,我首先必须了解现代机器人检测的实际工作方式,这让我深入研究了一个研究的“兔子洞”。结果是一个关于多层指纹识别的完整技术百科全书,我将其作为文档的一部分分享:<a href="https://pydoll.tech/docs/deep-dive/fingerprinting/" rel="nofollow">https://pydoll.tech/docs/deep-dive/fingerprinting/</a><p>核心论点是,现代规避并非关于随机性,而是关于整个堆栈中的完美一致性。Pydoll 是我基于该论点构建的工具。它是开源的,我非常欢迎大家对 asyncio 架构、类型安全 API 或研究本身的任何技术反馈。
9 分•作者: todsacerdoti•7 个月前
23 分•作者: bookofjoe•7 个月前
12 分•作者: embedding-shape•7 个月前
2 分•作者: ryan_j_naughton•7 个月前
2 分•作者: robtherobber•7 个月前
1 分•作者: stsffap•7 个月前
1 分•作者: jimmydin7•7 个月前
1 分•作者: gmays•7 个月前
2 分•作者: delichon•7 个月前