1作者: acro-v7 个月前
您好, 我正在构建一个终端原生代码生成工具,最近的更新之一是为那些不想将代码上传到第三方服务器的用户打包一个本地模型(Qwen 2.5 Coder 7B,首次下载成功)。 用户对这个新增功能的初步反馈是积极的——但我对此表示怀疑:这个模型相当基础,质量无法与在线产品相提并论。 因此,我计划改进 RAG(检索增强生成)能力,构建包含相关源文件片段的消息,添加规划调用,添加验证循环,也许还会进行多样本重排等:所有这些都是常见的技术,如果正确实施,可以提高输出质量。 所以,问题是:我相信(希望?)通过实现所有这些功能,7B 模型可以提升到大约 20B 模型的质量,您是否同意这种可能性,或者您认为这会是徒劳的,并且不会发生这种程度的改进? 源代码在这里——如果您喜欢,请给它点个星:https://github.com/acrotron/aye-chat
3作者: megraf7 个月前
平台在每个用户的个人资料中显示账户注册国家/地区是否有利? 我很好奇 HN 社区对此的看法,涉及隐私、版务、透明度、反滥用等角度,以及这是否能显著提高讨论质量。 公开展示这类元数据,有哪些强有力的理由支持或反对?
2作者: staloriana7 个月前
我为 .NET 构建了一个小型、针对缓存优化的 B+ 树存储引擎,名为 BTreePlus。 目标不是构建一个通用数据库,而是探索在针对 CPU 缓存行为、小型固定大小页面以及可预测的读/写路径进行调整时,一个最小的、现代 B+ 树设计能走多远。 在我的基准测试(链接在仓库中)中,BTreePlus 在特定键值风格的工作负载上表现出比 SQLite 和 Postgres 更好的吞吐量,主要包括: - 单键点查找 - 带有小页面的顺序插入 - 无复杂 SQL 层的读密集型场景 我希望数据库和系统工程师能就以下方面提供反馈: - 页面布局/拆分-合并逻辑 - 锁存模型 - 设计是否避免了经典的 B-树陷阱 - 基准测试方法(乐于调整或重新运行) NuGet:[https://www.nuget.org/packages/BTreePlus](https://www.nuget.org/packages/BTreePlus)
1作者: leo_e7 个月前
我们是一家正在构建专业搜索引擎的小型初创公司。刚开始时,我们的逻辑很简单:“性能是我们的主要特性,所以我们需要 C++。” 六个月过去了,运行时性能确实惊人,但我们的迭代速度却一落千丈。 感觉我们为每一个功能都付出了巨大的代价。就在昨天,我浪费了整个下午的时间与 CMake 斗争,仅仅是为了链接一个库,而这个库在其他任何生态系统中可能只需要一行代码的 go get 或 npm install 就能搞定。我们还经常遇到幽灵般的 bug,最终发现是我们的 M1 Mac 和 Linux CI 运行器之间微妙的 ABI 不匹配——这些问题在现代工具链中根本不存在。 这令人沮丧,因为我们“较慢”的竞争对手每周都在发布新功能,而我们却被困在调试链接器错误或等待 20 分钟的干净构建中。 我开始怀疑“性能护城河”是否是一个陷阱。对于那些最近开始基础设施项目的人:你们坚持使用 C++了吗?你们转向了 Rust/Go 吗?或者你们只是接受为了原始速度而牺牲开发速度?