最新

Vivaldi：我们的 2026 年发展蓝图

1 分•作者: jsheard•6 个月前

1 分•作者: kshk123•6 个月前

我开发了一个小型的浏览器扩展程序，用于帮助用户从任何网站上选中的文本创建提醒。我经常在电子邮件和网页上看到日期/时间信息（例如“下周二下午3点”、“2025年12月25日”、“14:30”），希望能够方便地将它们转换为提醒，而无需切换应用程序。工作原理： * 在任何网页上选择文本 → 右键点击“添加到提醒” * 它会检测常见的日期/时间格式（英语 + 欧洲/德语），并预先填充提醒时间 * 在弹窗中查看/编辑/删除提醒，或手动添加提醒 * 也可以手动编辑/添加日期，并且高亮显示的文本不必包含日期。可选集成（仅在您选择时）： * 通过OAuth与Google日历同步（创建事件） * 通过您在自己的机器上运行的小型本地桥接程序与macOS Apple Reminders同步链接： * Chrome网上应用店：https://chromewebstore.google.com/detail/create-reminders/ecifdofkbodefbieanakcmhnncjhflkh * Firefox附加组件：https://addons.mozilla.org/en-US/firefox/addon/create-reminders/

Show HN: Toad。一个统一的终端用户界面，用于编码助手

2 分•作者: willm•6 个月前

嗨，各位 HN 用户，到 2025 年年中，我曾是一家名为 Textualize 的初创公司的 CEO/CTO。不知怎么的，我设法为我的 Python 库获得了种子轮融资，这些库用于实现花哨的终端输出。三年后，我们结束了，因为资金耗尽了。老实说，那时我以为自己已经厌倦了编程。但事实证明，我厌倦的是压力和没日没夜地工作。几周的休息就足够了。大约在那个时候，编程代理爆发了，我再也不能忽视它们了。我对这些工具提供的用户界面印象不深。在终端工作了几年后，我知道你可以获得更好的用户体验。因此，这个项目诞生了。我曾计划在代理的 SDK 和前端之间创建一个中间层。幸运的是，在我开始构建这个项目后，Zed Industries 发布了 Agent Client Protocol (<a href="https://agentclientprotocol.com/" rel="nofollow">https://agentclientprotocol.com/</a>)。这正是我所需要的。我刚刚发布了代码（它曾是一个私有仓库一段时间）。Toad（Textual Code 的一个文字游戏）可以运行大量 AI 代理，并提供一个更友好的终端用户界面。可以把它想象成一个“自带代理”的编程 CLI。使用你想要的任何代理。我不是想向你推销代币。欢迎提问。如果这个帖子火了，我会在这里待一段时间。

展示 HN: Paper2Any – 开源工具，从研究论文生成可编辑 PPT

2 分•作者: Mey0320•6 个月前

大家好，我们是来自北京大学的 OpenDCAI 团队。我们开发了 Paper2Any，这是一个开源工具，旨在基于我们的 DataFlow-Agent 框架，自动化“论文转幻灯片”的工作流程。问题：撰写论文很困难，但创建专业的架构图和幻灯片（PPT）往往更加繁琐。大多数 AI 工具只能生成静态图像（PNG），这些图像无法进行调整以用于最终出版。解决方案：Paper2Any 接受 PDF、文本或草图作为输入，理解研究逻辑，并生成完全可编辑的 PPTX（PowerPoint）文件和 SVG 文件。我们优先考虑灵活性和保真度——允许您指定页面范围、切换视觉风格并保留原始素材。工作原理： 1. 多模态阅读：从论文中提取文本和视觉元素。您现在可以指定页面范围（例如，仅方法部分）以聚焦上下文并减少 token 使用量。 2. 内容理解：识别核心贡献和结构逻辑。 3. PPT 生成：它不是生成一张扁平的图像，而是生成独立的元素（块、箭头、文本），这些元素具有可选的视觉风格，并将它们组织成幻灯片布局。链接： * 演示：[http://dcai-paper2any.cpolar.top/](http://dcai-paper2any.cpolar.top/) * 代码 (DataFlow-Agent)：[https://github.com/OpenDCAI/DataFlow-Agent](https://github.com/OpenDCAI/DataFlow-Agent) 我们很乐意听取您对生成质量和 agent 工作流程的反馈！

Show HN: MiraTTS，一款 48kHz 开源 TTS，速度达实时 100 倍

2 分•作者: Yatharth3501•6 个月前

我一直在开发 MiraTTS，这是一个针对高真实感和稳定文本转语音（TTS）而微调的 Spark-TTS 模型。目标是创建一个速度极快但质量极高的模型。大多数开源 TTS 模型要么计算量大，要么生成 16-24kHz 的音频。Mira 通过结合以下两点来实现高保真度和速度： * **FlashSR：** 用于生成清晰、更清晰的 48kHz 音频输出。 * **LMDeploy：** 经过高度优化的推理，实现 100 倍的实时速度和低延迟（大约 150 毫秒）。我构建这个模型是为了让本地用户能够使用高质量的本地文本转语音模型，适用于任何用例。它目前还处于早期阶段，我正在尝试多语言版本和多说话人版本。流式传输功能也即将推出。项目代码库：[https://github.com/ysharma3501/MiraTTS](https://github.com/ysharma3501/MiraTTS) 模型：[https://huggingface.co/YatharthS/MiraTTS](https://huggingface.co/YatharthS/MiraTTS) 我还写了一篇关于这些基于 LLM 的 TTS 模型如何工作的文章：[https://huggingface.co/blog/YatharthS/llm-tts-models](https://huggingface.co/blog/YatharthS/llm-tts-models)

JEDEC 正在开发引脚数更少的 HBM4 标准，以实现更高容量

11 分•作者: rbanffy•6 个月前

Show HN: Composify – 开源 React 可视化编辑器 / 服务驱动 UI

15 分•作者: injung•6 个月前

现在大家都在争相推出 AI 工具，而我却带来了一个可视化编辑器。不过，我认为很多团队都对“市场部又想改着陆页了”这个问题非常熟悉。多年来，我一直遇到这种情况。活动页面来了，工程师们就被拉去帮忙，工单也堆积如山。通常都是相同的组件，只是重新排列一下。几年前，在一家我工作过的初创公司，我们构建了一个内部工具来解决这个问题。你注册现有的 React 组件，它们就会显示为可拖放的块，结果是一个 JSX 字符串。无需学习模式，也无需更改你的组件代码。我们把它用在了生产环境中，处理着一个混乱、遗留问题严重的真实流量。它表现良好。随着时间的推移，它支撑了我们大约 60% 的流量。市场部无需提交工单就能发布页面，产品团队也能进行布局级别的 A/B 测试。这段经历最终促使我清理并开源了它。Composify 的定位介于无代码页面构建器和无头 CMS 之间。像 Wix 或 Squarespace 这样的页面构建器提供了拖放功能，但会将你锁定在它们的组件中。也有像 Builder.io、Puck 和 Storyblok 这样出色的工具，但许多工具需要你将组件适配到它们的模型中。Composify 刻意保持极简：它让你直接使用实际的生产组件。现在还处于早期阶段。文档需要完善，还有一些粗糙的地方。但它已经在生产环境中运行，并且为我们解决了一个实际问题。如果你已经有一个组件库，并且希望非开发人员能够从中组合页面，它可能会对你有所帮助。主页：<a href="https://composify.js.org" rel="nofollow">https://composify.js.org</a>欢迎提问或提供反馈！

闪电演讲：你自己的 Godbolt [视频]

1 分•作者: mattgodbolt•6 个月前

已登记选民被标记为“潜在非公民”后，证明了公民身份

1 分•作者: hn_acker•6 个月前

Cabin – 现代、类似 Cargo 的 C++ 包管理器和构建系统

1 分•作者: whou•6 个月前

欧盟委员霍夫施特拉为取消2035年燃油车禁令辩护

1 分•作者: teleforce•6 个月前

人工智能在能源使用上超越了2024年比特币挖矿

2 分•作者: speckx•6 个月前

角膜塑形术在近视控制中的有效性

1 分•作者: bilegeek•6 个月前

游戏化过去：DIY考古视频游戏中具身大语言模型

1 分•作者: geox•6 个月前

你如何可靠地证明数据存在的时间？

1 分•作者: timeproofs•6 个月前

我经常在许多领域（文档、AI输出、数据集、代码、日志）遇到同样的问题。存储告诉我我现在有什么。版本控制告诉我发生了什么变化。但当发生争议时，真正的问题往往更简单：这些数据到底是什么时候存在的？截图、PDF、仪表盘、电子邮件…… 它们大多依赖于对系统或平台的信任。在许多情况下，存储或共享原始数据甚至不可行（隐私、合规性、规模）。我很好奇其他人今天是如何处理这个问题的。你见过哪些方法在实践中有效？

最新 MLX 版本包含基于 TB5 的 Jaccl RDMA 后端

1 分•作者: geerlingguy•6 个月前

Show HN: jax-js，一个用于 Web 的机器学习库和编译器

2 分•作者: ekzhang•6 个月前

Valve 正在反向操作苹果的策略

43 分•作者: ee64a4a•6 个月前

从2026年1月开始，所有ACM出版物将实行开放获取。

100 分•作者: Kerrick•6 个月前

Adobe Photoshop 1.0 源代码 (2013)

45 分•作者: tosh•6 个月前

上一页 1...2920 2921 2922 2923 2924...5530 下一页