2作者: nikhonit6 个月前
我开发这个工具,是因为我经常在 YouTube 上观看大量的技术讲座和长篇播客,但我发现自己会浪费几个小时,反复拖动视频进度条,只为了找到特定的引用或概念。<p>Recapio 是一款可以提取视频(和网页文章)的文字稿并生成结构化摘要的工具。它的目的不是取代观看内容,而是充当视频内容的“Ctrl+F”功能。<p>我遇到的一个技术挑战是:处理 YouTube 自动生成的字幕与强制字幕非常麻烦。我不得不构建一个解析器来规范时间戳,这样当你点击摘要中的某个要点时,即使字幕时间有偏差,它也能跳转到正确的帧。<p>它有一个免费套餐,应该能满足大多数用户的日常使用。我很想听听你们对提取质量的反馈。
1作者: zfoong6 个月前
很高兴宣布我们刚刚推出了 White Collar Agent——一个开源的通用计算机使用 AI 智能体,它通过 TUI 界面帮助您自动化基于计算机的任务(<a href="https:&#x2F;&#x2F;github.com&#x2F;zfoong&#x2F;WhiteCollarAgent" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;zfoong&#x2F;WhiteCollarAgent</a>)。 该智能体可以自主解释您的指令,规划行动,并执行任务以实现广泛的自动化目标。该代码也为构建您自己的 AI 智能体奠定了基础。它可以执行 Web 任务并自动化操作系统操作,例如高容量重复性工作和批量处理。 想将整个目录的文档翻译成日语吗?根据每个文件中的内容整理杂乱的文件文件夹?扫描一个图像文件夹并为每个图像自动生成标题?这些都是 White Collar Agent 可以轻松自动化的任务。 附注:您可以自由使用、托管甚至通过 White Collar Agent 盈利。如果您是 AI 工程师或构建者,这里有一个自定义智能体层,可以让您创建可以托管的专业智能体。您所要做的就是注入智能体的身份和自定义工具。 GUI 模式仍处于实验阶段。如果您有开发 GUI 智能体的经验,我们邀请您一起合作(请联系我们!)。
2作者: nishilpatel6 个月前
我正在寻找高质量的工程技术博客文章范例——尤其是来自科技公司博客的文章,这些文章需要超越表面层面的解释。 具体来说,我感兴趣的文章需要: 1. 清晰、简洁地解释技术概念 2. 展示真实的实现细节、权衡和失败案例 3. 结构清晰,易于阅读 4. 将工程决策与业务或产品成果联系起来 您经常从中学习的优秀博客、文章或平台有哪些?
7作者: brinedew6 个月前
我制作了一个受 Geoguessr 和 Wordle 启发的网页游戏,每天会展示一个随机的人类蛋白质的 3D 模型,你需要通过相似性线索来推断出它的基因名称。<p>我的背景是湿实验室分子生物学,我希望这个游戏主要能吸引其他生物学家。但如果你不是这个领域的,我也很想知道你是否能通过使用浏览器和大型语言模型(LLMs)来解决它,以及你是否从中学习到了一些有趣的东西。请告诉我你的想法。<p>这个游戏是我在过去两个月里用 Claude 制作的。我的编码经验仅限于基本的 Python 数据分析和绘图。我看到网上有人问:“既然我们有了编码 AI,为什么没有非程序员制作的、大量由 AI 生成的优秀应用程序?”——如果这听起来像你,请访问 Geneguessr 了解一下非程序员制作的网页应用是什么样的。<p>如果大家有需求,我可能会写更多关于这个过程的文章,但真正解锁这个项目的关键是 Linear MCP,它能让我把每个单独的问题放在一个共享的看板上。这个以及用于在实际网站上测试的 Playwright MCP 是帮助我完成这个项目的两大主力。对于 Claude 无法一次性解决的错误,Linear 非常适合整合问题信息,这样我就可以把它输入到 ChatGPT Codex 中——它通常会思考大约半小时,输出非常令人困惑的解释,但错误就消失了。<p>游戏是免费的,无需登录,如果遇到任何移动端错误,请见谅——我没有在那里进行太多测试。<p><a href="https:&#x2F;&#x2F;geneguessr.brinedew.bio&#x2F;" rel="nofollow">https:&#x2F;&#x2F;geneguessr.brinedew.bio&#x2F;</a>