7作者: deaux7 个月前
从五天前开始,我们微调的 2.5 Flash 模型的延迟突然增加了 5 倍。对于不太熟悉的人来说,这种微调模型通常用于以更低的延迟和成本,在特定任务上接近大型模型的性能。这意味着它们通常用于需要大量使用并希望快速响应用户的实时生产场景。否则,微调通常是不值得的。许多人至少花费几千美元来微调一个模型以完成一个这样的任务。 五天前,谷歌向世界发布了 Nano Banana Pro (Gemini 3.0 图像预览)。从五天前开始,我们现有的微调模型的延迟突然增加了五倍。我们与其他也使用微调 2.5 Flash 模型的初创公司进行了交谈,他们也遇到了同样的问题,即使是不同地区的初创公司也是如此。这显然对我们所有的产品都产生了巨大的影响。 从谷歌方面来看,除了沉默什么都没有,这还是在付费支持的情况下。对最初的支持工单的回复是要求提供已经在该工单中提供或显而易见的基本信息。从那以后,已经超过 48 小时没有任何回应。 当然,时间上的巧合也可能纯属巧合——尽管我们以前从未见过任何这样的延迟不稳定情况——但我们都可以看到最可能发生的事情:Nano Banana Pro 和 Gemini 3 预览版消耗了大量的计算资源,他们只是为了这些而牺牲了微调模型的输出。 在此之后,不可能认真对待他们用于商业用途,谁知道他们下次会做什么。 尽管存在各种问题,OpenAI 却一直是稳定性的堡垒,尽管它在所有前沿模型提供商中最注重 B2C。 谷歌的 Vertex 声称一切都以企业为中心,然后破坏其商业客户的产品,以便消费者更快地获得他们的吉卜力图像 1%。 他们肯定收到了很多关于此事的工单,并且考虑到谷歌的工程能力,他们一定有自动监控系统,可以立即捕捉到如此巨大的延迟增加。 临时中断是可以理解的,并且在任何地方都会发生,最近的 AWS 和 Cloudflare 也是如此,但 5 天以上——即使他们修复了它——5 倍的延迟实际上相当于服务中断 5 天以上。 我发布这篇文章主要是为了警告其他初创公司,以后不要依赖谷歌 Vertex 来满足面向用户的模型需求。
2作者: jelly_shelly7 个月前
大家好。我一直在构建一个小实验,想和大家分享一下。<p>Jelly 是一个完全通过 SSH 加入的社交空间。 没有网页,没有应用程序,没有登录流程。 你的 SSH 公钥就是你的身份。<p>我想要一些像早期互联网社区的感觉。简单,没有算法,没有煽动性内容,没有抓取,没有 AI 内容。 只有人们在终端上实时聊天。<p>目前的功能<p>加入方式:ssh jellyssh.xyz<p>如果你没有密钥:ssh-keygen -t ed25519<p>公钥自动创建账户<p>带有实时更新的全局动态<p>话题标签变成频道(前 5 个活跃话题)<p>ASCII 个人资料图片 + 个人资料主题<p>留言簿 / Top 8(MySpace 情怀)<p>使用 Bubble Tea 构建的 TUI<p>SSH 服务器由 Wish 提供支持<p>sqlite 后端,没有跟踪或分析<p>不存储密码、电子邮件或个人数据<p>它还处于非常早期的阶段,而且粗糙,但足够稳定可以尝试。 仍在完善输入处理、速率限制和防崩溃功能。<p>如果你试用了它,我很乐意听取你的想法/反馈。 这只是我一个人在构建,我正在边做边学。<p>ssh jellyssh.xyz<p>感谢阅读。
1作者: Vivek1234137 个月前
Hi HN, 我开发这个工具是因为我厌倦了将我的个人照片上传到第三方服务器上进行压缩。我想要一个完全在客户端完成所有操作,从而保护隐私的工具。 它完全在你的浏览器中运行(数据不会离开你的设备),因此没有文件大小限制或上传等待时间。目前它支持批量压缩 JPG、PNG 和 WebP 格式的图片。 我正在 ToolboxNest 上构建一套更大的工具。我很乐意听取您对压缩质量和用户界面的反馈!
1作者: dils7 个月前
最近,我一直在参与各种开源项目。我主要处理标有“新手友好”标签的问题。在开始解决问题之前,我通常会先看看其他人之前的尝试。如果问题出现超过一年,我通常能找到几个PR或评论。通过查看工作历史,通常就能明白之前的尝试为什么没有成功:有人完全误解了任务并走错了方向,有人几乎不会写代码,还有人只是在@贡献者,而不是真正地解决问题[1]。让我感到惊讶的是,维护者几乎总是有时间回答每一个问题,审查那些荒谬且错误的PR,并花几天时间与贡献者(包括我)沟通,提供关于工作的反馈,而他们自己完全可以在不到一个小时内解决这个问题。老实说,我不明白为什么一个拥有10年以上经验的人会花时间审查我的“新手友好”PR,好像他们没有其他事情可做一样。我努力想做出贡献并学习,但我不希望打扰任何人或浪费任何人的时间,这就是为什么我想知道维护者为什么要花时间审查我的代码?他们的动机是什么? [1] https://github.com/tensorflow/tensorflow/issues/22926#issuecomment-2888463504
2作者: lakshikag7 个月前
我一直在使用 status.cafe,非常喜欢它,但有一件事一直困扰着我,那就是无法导出我多年来发布的所有状态更新。如果有一天这个网站关闭了,整个历史记录就消失了。<p>带着这个想法,我构建了 kibun.social,一个类似于 status.cafe 的极简服务,它建立在 atmosphere 之上,atmosphere 是 Bluesky 使用的相同的开放社交协议。<p>因为它是一个去中心化的平台,您发布的每条状态更新都直接存储在您的 PDS 中。您可以导出它们,转移到另一个应用程序,或者将来构建您自己的前端。该平台基本上只是您数据之上的一个查看器/编写器。<p>它非常简单,只需几秒钟即可更新您的状态。您使用您的 atproto 句柄登录,选择一个表情符号并发布您的状态。如果您想在其他地方关注它们,您还可以获得自己的状态 RSS 订阅源。<p>现在还处于早期阶段,但我很想听听大家的想法——特别是那些喜欢小型社交空间和去中心化网络的人。