返回首页

一周热榜

2作者: remywang6 天前
很高兴与大家分享 Prela 查询语言的“第二版”。 在分享了上一版本后,我收到了一些宝贵的反馈,其中最主要的是基于 Unicode 的奇怪语法让大家感到困惑。 Prela 现在拥有更熟悉的类 SQL 语法,同时遵循代数原理,这使得该语言具有组合性和可控性,并且核心引擎的代码量仍保持在 1k 行以内。 引擎也已从 Julia 重写为 Rust,这带来了更简洁的代码和更快的性能(这不仅仅是因为“Rust 快 Julia 慢”,还涉及一些深入的编译器层面的原因,我希望将来能写文章详细介绍)。 长远来看,我认为 Prela 的价值不在于它是一个独立的查询语言,而在于它展示了关系组合子的强大功能,这些组合子可以像迭代器一样,在任何语言中实现。
2作者: AbstractH244 天前
很明显,人工智能公司正逐渐转向关注这一点。 在泡沫破裂之前,90年代是否有过这方面的努力? 我那时还是个孩子,只记得像“杂货界的Priceline”这样的概念和疯狂的首次公开募股(IPO),但除此之外记得的不多。 我一直对其中的相似之处和可以吸取的教训很感兴趣。
2作者: woutervd5 天前
我喜欢字典游戏:一个人从字典里找一个生词,然后写下它的定义。接着,其他玩家也写下自己编造的、假的定义,然后大家一起猜哪个是真的。<p>我基于这个概念制作了一个类似 Wordle 的每日游戏。游戏会显示一个单词和四个定义,由你来判断哪个是真实的。每天都有五个新词可以尝试。<p>真实的定义来自维基词典,虚假的定义则由 Claude(有时也包括我)编造。<p>请告诉我你的想法,以及如何改进这个游戏!
2作者: the-mitr6 天前
您使用了哪些模型和硬件?用于什么目的?遇到了哪些挑战?有什么技巧帮助您完成了这项工作?<p>这或许能帮助像我一样的新用户进行设置。
2作者: hillj235 天前
找工作真烦人。在 LinkedIn 和 Indeed 上翻找,从猎头那里收到无数垃圾邮件,他们试图覆盖尽可能大的受众,点击“快速申请”却石沉大海,还要费力分辨哪些工作是真的。我妻子几个月前开始找工作时就遇到了这些问题,所以我为她构建了一个工具,帮她分担最糟糕的部分。结果就成了这个。哦,对了,她不到两周半就收到了一家大公司的录用通知书。现在,她很喜欢她的工作。 Morning Stack 在夜间运行。当用户入睡时,它会遍历大型招聘网站(以及一些小众网站),然后尝试验证每一个职位信息,然后再信任它。 这份工作是真的吗?——它会在真实浏览器(Playwright)中打开职位信息并进行检查。我们不进行 API 抓取,也不登录任何账户。然后,我们会回溯到公司自己的 ATS 页面,以便您直接向他们申请。如果找不到,该职位将被删除。 它符合您的要求吗?——一个 LLM 会将职位描述与您的个人资料(简历、职业故事、期望职位、薪资范围、地理位置和福利)进行交叉比对。您越具体,最终收到的职位就越少。这正是其意义所在。 对于少数幸存下来的候选职位,它会根据职位描述调整您的实际简历并为每个职位起草一封求职信。一个独立的验证器会再次阅读这些内容,并与您的实际简历进行比对,剔除任何无法支持的事实。我们通过三振出局规则来避免 AI 生成的虚假信息:如果一个声明尝试三次后仍无法得到支持,它就会放弃该职位,继续前进,而不是发送虚假信息。 到早上 7 点,您将收到一小叠(最多 3 个)真实的职位空缺以及完整的申请材料。 - 您会看到每个职位的一些有用的信息(公司和职位信息,以及任何异常情况,如高薪或无限带薪休假)。 - 您会进行审查,以确定您是否感兴趣。 - 您自己进行润色,并在公司最直接的网站上提交申请。 就是这样。这是您的声誉;您自己掌控。以下是我特意没有构建的功能: 它绝不会登录您的任何实际账户,也绝不会代表您自动申请。在我看来,这是一种非常糟糕的趋势。我不认为它有效,也不认为人们信任它。“广撒网”不适合那些关心职业发展结果的人,您将始终以自己的名义提交申请。 本周将向一小部分测试用户开放。有一个等候名单。链接在上面。 我很乐意在评论中深入探讨架构或服务条款的理由。
2作者: reuven4 天前
我为我的在线学习平台和企业培训课程创建了一个浏览器内的 Python/Pandas/Git 实践环境。我很乐意讨论我是如何设计这个环境的,如何在我的课程中使用它,以及我所做的架构决策。 对我来说,最有趣的是有多少功能是在浏览器中运行的。得益于 Svelte、Pyodide、isomorphic-git、LightningFS 和 CodeMirror,我能够提供一个完整的 Python、Pandas 和 Git 环境。 我使用 Claude Code 构建了其中的大部分内容,我很乐意讨论这个过程——哪些方面效果很好,哪些方面我不得不自己介入并做出决定。 我对 Git 模拟器尤其感到兴奋:它可以在您运行命令时显示提交树的变化,以及文件在工作区、暂存区和 HEAD 之间移动的动画视图。 AI 导师使用了 Claude Haiku,它以我的新闻通讯、课程和练习作为输入,并附带了我教学方法的描述:讲师应该提供提示和反馈,但不透露答案。
2作者: RoyalTnetennba6 天前
我需要一个分类器来处理那些不属于典型机器学习应用场景的、细微的、主观的分类(例如,“这是否是剧透?”、“这是否事实正确?”、“这个用户是否在说谎?”)。我最终对我构建的解决这个问题的架构非常满意,于是我将其作为一个独立的 API 和服务推出了,名为 CriteriaBot。 **它的作用:** 你提供内容和简单的英文标准。它会给出内容是否符合这些标准是/否的判断。 **它的工作原理:** 除了传统的分类器外,分类请求还会通过一个由小型、开放权重的大型语言模型(LLM)组成的池进行路由,以达成共识判断。 我构建了一个预投票因子分解机,根据主题/类别的嵌入来选择一个优化的 LLM 子集,以获得最佳信号强度。然后,第二个因子分解机读取投票和嵌入,得出单一的判断。该判断会根据用户在语义相似评估中与模型达成一致/不一致的历史记录进行动态调整。 这些模型还连接到维基百科和 Wolfram,以支持需要最新信息或数学依据的边缘情况。 **发现:** * 使用相同的测试环境和样本集,Gemma 4 26B 的准确率仅比 Opus 4.8 低约 1 个百分点。 * 纯粹的“神谕”模型理论上非常好——目前在数据集上准确率约为 98%。我将第二个因子分解机用作组合器,因为它理论上可以超越“神谕”结果,但这是一个有趣的备用方案。 * 最有用的大型语言模型出乎我的意料——LFM2 24B 对共识的贡献最大,尽管它单独来看(在我们目前的大型语言模型池中)是最差的。它与其他模型的关联度最低(也许是由于其独特的架构?),这使得它在某些问题上成为一个有用的信号。 * 处理用户提交图像的法律义务……非常复杂。在我解决这个问题之前,我已经为非我本人用户禁用了图像支持(如果你希望尝试“热狗,不是热狗”的话)。 * Rails 将“criteria”的复数形式错误地单数化为“criterium”,直到我花了大量精力去修复才意识到这是错误的。 **发布原因:** 我一直处于倦怠状态,而让这个项目运行起来让我感到非常满足。我生活中大部分非技术人员很难对此给出除了“这是什么?”之外的反应。 我非常乐意收到你任何诚实的反馈。