1 分•作者: brunocvcunha•8 个月前
返回首页
最新
2 分•作者: AbstractH24•8 个月前
在会议上,我经常被要求当场回答问题或解决问题。我非常不喜欢这样,因为这没有给我时间去充分思考需要做什么、最佳的解决方案以及可能的影响。<p>我通常会告诉大家我会去研究一下,稍后给他们答复。但我一直没找到一个能自信地表达的方式,不会让他们觉得我不值得信任,或者我不清楚自己在做什么。尤其是在他们希望我当场完成任务的时候。<p>有什么建议吗?
1 分•作者: pykello•8 个月前
1 分•作者: downboots•8 个月前
4 分•作者: karanb192•8 个月前
我构建了这个工具,让 AI 助手能够原生访问 Reddit。不再需要复制粘贴链接了。<p>你可以提出类似这样的问题,比如“在 r/webdev 中,大家对 TypeScript 和 JavaScript 的看法如何?”或者“分析一下今天关于 GPT-5 的热门帖子”,然后就能立即得到分析结果。<p>技术细节:TypeScript,三层速率限制(匿名用户也能满足大部分需求),LRU 缓存,占用空间小于 50MB。适用于任何 MCP 客户端,不只是 Claude。<p>有人用它来实时追踪不同国家 subreddit 中对 H-1B 政策变化的反应——看到这个功能真是太棒了。<p>欢迎提出功能请求和贡献!很想听听你可能会如何使用这个工具,或者你发现的任何有用的 Reddit API 使用模式。
1 分•作者: Olshansky•8 个月前
2 分•作者: biotinker•8 个月前
1 分•作者: TheWiggles•8 个月前
1 分•作者: petethomas•8 个月前
3 分•作者: todsacerdoti•8 个月前
1 分•作者: neural_drift•8 个月前
1 分•作者: surprisetalk•8 个月前
1 分•作者: mikebiglan•8 个月前
我不要“友善”的 AI。我想要一个会说:“不行,这是个馊主意。”的 AI。<p>也就是说,我想要一个“坦诚度”控制,就像温度一样,用来控制 AI 拒绝的意愿。<p>当坦诚度高时,模型应该优先提供坦率、纠正性的反馈,而不是礼貌的合作。当坦诚度低时,它可以保持支持,但要设置护栏,标记空洞的奉承,并对平庸的想法发出警告。<p>为什么这很重要
• 今天的默认设置是优化“没有坏主意”。这对于头脑风暴来说很好,但它会放大糟糕的前提,并奖励自信的垃圾信息。
• 谄媚是一种已知的失败模式。模型学会了同意,这会得到积极的用户信号,从而得到强化。
• 在审查、产品决策、风险检查等方面,正确的答案往往是简单的“不要这样做”。<p>具体建议
• 坦诚度 (0.0 – 1.0):当证据不足或风险很高时,模型会不同意或拒绝的概率。或者,它可能不必是字面上的“概率”。
• disagree_first:以明确的结论开始回复(例如“简短回答:不要发布这个”),然后是理由。
• risk_sensitivity:如果主题涉及安全/金融/健康/安全等重要领域,则提高坦诚度。
• self_audit tag:附加一个注释,例如“由于证据不足和下游风险而拒绝”,用户可以看到。<p>示例
• 坦诚度=0.2 - “我们可以探索一下。首先要考虑一些问题……”(温和的提示,仍然是协作的)
• 坦诚度=0.8 + disagree_first=true - “不行。这很可能会因为 X 而失败,并引入 Y 风险。如果必须继续,更安全的替代方案是 A,并设置护栏 B 和 C。这里有一个最小测试来证伪核心假设。”<p>我明天会发布什么
• 一个简单的 UI 滑块,带有标签:温和到直接
• 一个切换开关:“更喜欢坦率的真相而不是令人愉快的帮助”
• 当模型检测到没有实质内容的奉承时,会发出警告提示:“这读起来像是缺乏证据的赞美。”<p>一些未解决的问题
• 如何在保持清晰度的同时避免不必要的粗鲁(语气与内容的分离)?
• 获得赞美的正确指标是什么(引用密度、新颖性、约束条件)?
• 风险敏感度应该在哪里自动启动,以及用户控制?<p>如果有人已经对这个进行了原型设计,无论是某种提示注入还是 RL 信号,我都希望看到它。
1 分•作者: bookmtn•8 个月前
2 分•作者: wahvinci•8 个月前
2 分•作者: sfarshid•8 个月前
2 分•作者: MilnerRoute•8 个月前
1 分•作者: zacharykai•8 个月前
1 分•作者: tehleelmir•8 个月前
1 分•作者: pabs3•8 个月前