Show HN:基于 Web 的二维几何计算器 2 分•作者: ccorcos•8 个月前我经常发现自己试图解决几何问题,这些问题的约束条件非常容易理解,但用代数方法求解却非常困难和繁琐。 我完全用 Claude Code 从头开始构建了这个东西。这是我第一次尝试,我实际上没有写一行代码…… 也就是说,即使作为新手,构建这个东西仍然很困难。我不得不引导它沿着顺利的路径前进,但这为我节省了大量时间! 代码是开源的!如果您遇到任何问题,请告诉我。
Launch HN: RunRL (YC X25) – 强化学习即服务 10 分•作者: ag8•8 个月前大家好,我们是 RunRL 的 Andrew 和 Derik(<a href="https://runrl.com/">https://runrl.com/</a>)。我们搭建了一个平台,通过强化学习来改进模型和智能体。只要你能定义一个指标,我们就能让你的模型或智能体变得更好,而你无需考虑管理 GPU 集群的问题。 这里有一个演示视频:<a href="https://youtu.be/EtiBjs4jfCg" rel="nofollow">https://youtu.be/EtiBjs4jfCg</a> 我(Andrew)之前在研究语言模型的强化学习,当时大家都不用 RL,因为运行起来太难了。后来我意识到,总得有人坐下来,真正写一个好的平台来运行 RL 实验。 一旦平台搭建起来,人们就开始用它来做抗病毒药物设计、形式验证、浏览器智能体等一系列很酷的应用,所以我们决定以此为基础创办一家初创公司。 工作原理: * 选择一个开源权重的基础模型(RL 更新需要权重;Qwen3-4B-Instruct-2507 是一个不错的起点) * 上传一组初始提示(“生成一种针对 Sars-CoV-2 蛋白酶的抗病毒药物”、“证明这个定理”、“温得和克夏季的平均最高气温是多少?”) * 使用 Python、LLM 作为评判者,或两者结合来定义奖励函数 * 对于复杂场景,你可以定义一个完整的多轮环境 * 看着奖励上升! 对于大多数定义明确的问题,小型开源模型 + RunRL 的表现优于前沿模型。(例如,我们看到 Qwen-3B 在抗病毒药物设计方面的表现优于 Claude 4.1 Opus。)这是因为 LLM 的智能表现具有明显的“峰值”特征;模型通常在常识性知识方面表现平平,在少数几个领域表现出色,但在许多其他任务上会犯错。RunRL 恰好在那些你最需要的任务上创造了“峰值”。 定价:每节点小时 80 美元。大多数参数在 140 亿以内的模型都适合在一个节点上运行(0.6-1.2 TB 的 VRAM)。我们进行完全微调,代价是参数效率(使用 RL 时,人们似乎非常关注例如智能体可靠性方面最后几个百分点的提升)。 下一步:持续学习;工具使用。工具使用目前处于内测阶段,你可以在这里加入:<a href="https://forms.gle/D2mSmeQDVCDraPQg8" rel="nofollow">https://forms.gle/D2mSmeQDVCDraPQg8</a> 我们很乐意听取任何想法、问题,或者积极或消极的反馈!
Ask HN: 最近几周,Claude Code 对你来说是不是没那么好用了? 1 分•作者: vintagedave•8 个月前过去几周,我发现使用 Claude Code 变得困难多了。它似乎对一些众所周知的库(比如我常用的 .Net)的理解不如以前,我不得不从 GitHub 上下载库的源代码,并指示它阅读这些库才能知道如何使用;它也不太听从指令;它经常向我保证问题已经解决,但有时却忘记了关键部分;而且它经常无视它的记忆:例如,即使我之前存储的指令是“未经我确认绝不提交”,它还是会提交。这开始变得非常耗时,我的工作效率甚至不如不久前。其他人也有这种感觉吗?
面向外籍人士和数字游民的在线心理咨询 1 分•作者: ElysiumAbove•8 个月前您好,我是米里亚姆——一位心理学家和创伤知情教练。 我专注于与希望在过着地点独立生活的同时感到踏实和充实的*数字游民和外籍人士*合作。 我的许多客户都在与以下问题作斗争: - 旅行时感到孤立或与世隔绝 - 难以在旅途中维持人际关系 - 对工作、财务或未来感到焦虑 - 难以建立支持心理健康的日常作息 - 当生活感觉不确定时,讨好他人、自我怀疑或倦怠等旧有模式会重新浮现 在我们的共同工作中,我们结合了循证心理治疗工具、躯体实践和关系疗愈方法。 我拥有2年的临床经验,并接受了彼得·莱文、皮特·沃克和丹尼尔·布朗的培训。 我帮助您创造一种*内在的稳定感、韧性和自信心*,这样您就可以茁壮成长——无论您身在世界的哪个地方。 *我们如何合作* 我们在一个私人平台上会面,您可以选择视频或音频会话——非常适合您在旅途中。 *费用* 60分钟150美元 *联系方式* 在这里给我发私信或发送电子邮件至helpwithmiriam@gmail.com