1作者: rileygersh6 个月前
我在使用苹果最新的 iOS 26 Foundation Models 框架进行开发时,遇到了一个常见问题。由于训练截止日期的限制,所有主流的大型语言模型(LLM)(GPT-4、Claude、Gemini)都对它一无所知。 与其等待数月直到模型更新,我花了 2 个小时构建了自定义训练数据: 研究:使用 Gemini 的深度研究功能,爬取了所有可用的文档、论坛、GitHub 仓库、Reddit 帖子和 YouTube 视频转录。搜索关键词为“iOS 26 Foundation Models Framework”。 优化:让 Claude 将所有内容重构为干净的、分层 Markdown 格式,并针对 LLM 摄取进行了优化。 实施:将其加载到 Claude Projects 中,作为一个自定义知识层。 结果:从“我没有关于这方面的信息”到获得关于前沿 API 的专家级指导。我的开发流程从反复试验转变为流畅的 AI 辅助实施。 这项研究非常彻底,甚至引用了我前一天在苹果开发者论坛上发布的帖子——创建了一个奇怪的递归循环,我正在用我刚刚贡献的知识来训练 AI。 这种方法适用于任何新的框架或 API。模式是可预测的:每次重大发布都会创建一个临时的知识空白,而自定义训练数据可以填补这个空白。 技术文章及方法论:https://rileygersh.medium.com/how-i-gave-claude-gemini-knowledge-of-ios-26s-foundation-models-03395d7e905c
2作者: pella_may6 个月前
想知道像 Kafka(或其他替代方案)这样的事件驱动技术是如何融入大型 LLM 提供商的后端和/或基础设施的。 我主要想到的问题有: 1. 大型 LLM 提供商如何处理训练数据、评估结果和人类反馈的流程?这些是通过事件流(如 Kafka)进行实时处理,还是更多地依赖批处理和传统的 ETL 管道? 2. 对于具有依赖关系的复杂 ML 管道(例如,数据摄取 -> 预处理 -> 训练 -> 评估 -> 部署),他们是否使用事件驱动的编排,其中每个阶段发布一些完成事件,或者他们是否使用传统的流程编排器,如 Airflow,并采用基于轮询的依赖关系管理? 3. 他们如何处理实时性能监控和安全信号?这些是能够触发即时响应(如模型回滚)的事件驱动系统,还是主要进行批处理分析,并有一些延迟的反应? 我基本上是想了解事件驱动范式在现代 AI 基础设施中的应用程度,如果有人正在(或曾经)从事这方面的工作,我很乐意听取任何高层次的见解。
5作者: efecan06 个月前
Hi HN, 我是一名最近毕业的计算机科学专业的毕业生。 在过去的几个月里,我编写了 BinaryRPC,这是一个开源的 RPC 框架,使用现代 C++20 编写,专注于低延迟的二进制 WebSocket 消息传递。 我为什么构建它: * 希望拥有第一流的会话支持、可插拔的 QoS 等级和一个简单的中间件链(全局、特定、多处理程序),而无需额外的 JSON/XML 解析。 * 提供简单的开发者体验 快速的功能列表: * 二进制 WebSocket 帧 – 最小的开销 * 内置会话层(登录/重新连接/心跳) * QoS1 / QoS2,带自动 ACK 和重试 * 插件系统 – 房间、msgpack 等,只需一行代码即可添加 * 线程安全的核心:RAII + folly 目前还处于早期阶段(个人项目),因此对设计、并发模型或缺失的必备功能的任何反馈都将非常有帮助。 感谢阅读! 另请参阅“使用 BinaryRPC 在 5 分钟内构建聊天服务器”:[https://medium.com/@efecanerdem0907/building-a-chat-server-in-5-minutes-with-binaryrpc-qos2-session-management-and-room-plugin-ccb66d722466](https://medium.com/@efecanerdem0907/building-a-chat-server-in-5-minutes-with-binaryrpc-qos2-session-management-and-room-plugin-ccb66d722466)
2作者: alessandro-a6 个月前
嗨,各位 HN 用户! 我是 Elara 的开发者。Elara 是一款可以自动扫描你的代码,查找安全问题的工具,例如配置错误、泄露的密钥和风险软件包等,让你专注于构建,而无需为这些问题烦恼。它的设计目标是简单快捷。 我看到很多人在发布在线产品时,甚至不知道自己可能存在哪些安全风险。如果你是开发者或从事技术工作,你就会知道维护系统安全有多难。但令人震惊的是,似乎没有人真正关心这个问题。 我想帮助大家尽早发现这些问题,避免遭受损失。 Elara 可以同时运行多个安全扫描器,将结果汇总到一个界面中,并为你提供一个可操作的待办事项列表,用于修复问题。 试用起来非常简单,只需使用 GitHub 登录即可亲自体验。 非常感谢你的反馈!