返回首页

一周热榜

2作者: turth5 天前
大家都知道塔吉特(Target)的市场营销人员通过顾客的购物记录,推断出一位少女怀孕了,甚至比她的父母还早知道这件事。有人研究过大型语言模型(LLM)预测用户细节的能力吗?如果研究过,用户需要和LLM聊多久,在对话中泄露多少个人信息,预测才会变得准确? 我能想象一个可怕的场景:在几个月里,我偶尔向ChatGPT提一些技术问题,OpenAI就掌握了向我推销新袜子的最佳方式,甚至在我自己知道会怎么做之前,就能预测我在某些情况下的行为。网上似乎很少讨论这个问题,这很奇怪,也许是因为这方面的研究确实还不多?
2作者: yaoluxing6 天前
一个免费的、基于网络的 Facebook 视频下载器,真正保留了原始音频——这是大多数 Facebook 下载器做不到的。它使用 Next.js 和 yt-dlp 构建,提供干净、无广告的体验,可以下载多种质量的 Facebook 视频。
2作者: dallen975 天前
Kling 刚刚发布了 VIDEO 3.0,这是对其 2.6 和 O1 模型的重大升级。 主要改进: * **延长时长:** * 最长可达 15 秒的连续视频(之前为 5-10 秒) * 灵活的时长范围,从 3 秒到 15 秒 * 更适合复杂的动作序列和场景发展 * **统一的多模态方法:** * 整合了文本生成视频、图像生成视频、参考生成视频 * 在一个模型中进行视频修改和转换 * 原生音频生成(与视频同步) * **两种变体:** * VIDEO 3.0(从 2.6 升级) * VIDEO 3.0 Omni(从 O1 升级) * **增强功能:** * 基于参考生成的更佳主体一致性 * 更好的提示词遵循和输出稳定性 * 在故事板和镜头控制方面更灵活 这使得 Kling 在市场上具有竞争力,可与以下产品竞争: * Runway Gen-4.5(每月 95 美元) * Sora 2(有限访问) * Veo 3.1(谷歌) * Grok Imagine(刚刚登上榜首) 15 秒的时长特别引人注目——与典型的 5 秒短片相比,它能够实现更强的叙事性。结合原生音频,这可能会改变内容创作者的工作流程。 公告中未提及定价。之前的 Kling 模型价格在每月 10-40 美元之间,远低于 Runway。 有人已经可以测试了吗?好奇在新的时长下,质量与 Runway 和 Sora 相比如何。
2作者: mishang5 天前
我们开发 TabChop 的初衷是,因为分账这件事至今仍让人觉得异常麻烦。有人下载了 App,结果扫描账单不准,界面又不好用,最后半桌人都放弃了。<p>在经历了无数次“解决方案”演变成未决请求和 Venmo 混乱的晚餐后,我们想要一个能简单奏效的工具。<p>TabChop 从账单开始。拍张照片,分享一个短代码,每个人认领自己点的菜。你可以实时看到账单更新,大家认领菜品的过程一目了然,再也不会有“谁点了什么?”的困惑。<p>我们还存储了每个人的 Venmo、Cash App 或 Zelle 信息,分账完成后,只需一键支付。再也不用尴尬地询问该付给谁,以及付多少钱。<p>我们的目标很简单。没有摩擦,没有计算,没有尴尬。只需一种无痛的方式来分账。
2作者: susam4 天前
大家好!这是又一个周末社交话题。在这个话题里,我想请大家分享一下最近自动化处理的个人琐事。具体来说,请分享: 1. 之前你是如何手动完成这项任务的? 2. 你是如何实现自动化的(工具、脚本、设备)? 3. 它现在运行顺畅吗?或者你经常需要调整它吗?
2作者: digi_wares5 天前
我在 texttospeech.site 上搭建了一个简单的文本转语音转换器。 免费版:每天 10 次生成,标准语音,无需注册。 专业版:Neural2 语音,2000 字符,可下载 MP3 文件。 技术栈:Next.js,Google Cloud TTS API,Vercel。 这个 2 美元的域名是我在 speechtotext.xyz 卫星站为我的主产品带来了 22% 的流量后,进行的一次 SEO 实验。我想看看完全匹配关键词的域名对 TTS 搜索是否仍然有效。 欢迎反馈——尤其是关于语音质量和用户体验的。