1 分•作者: fanf2•7 天前
返回首页
一周热榜
1 分•作者: dhruv3006•6 天前
1 分•作者: priyanshujain•5 天前
1 分•作者: grandimam•6 天前
我用 Notion 写日记好几年了,但我发现切换到它的 DSL(领域特定语言)的认知成本对我来说不划算。Notion 基于块构建,比如建立在块之上的数据库。即使我将笔记导出为 Markdown 格式,它仍然反映了 Notion 的内部数据结构,而不是给我一些干净且可移植的东西。
例如,内联数据库最终会变成一个表格,其中包含指向文档其他部分的 href 链接——很好,但当我想要可以实际使用的纯文本时,它就不是很有用了。
与此同时,我一直在进行大量的提示,而 Markdown 更适合我的工作流程。它不是一个日记工具,但它简单且被广泛支持——GitHub、VSCode 等,并且它消除了使用专用笔记应用程序带来的许多上下文切换。
我可能会怀念的是内联数据库和其他丰富的内容,但我已经学会了停止使用它们。但是,我已经将我的日记工作流程优化到很多我的提示技巧。我使用常规表格并更刻意地拆分文档。如果需要,我会在日记之间引用它们,有点像为工作流程的每个部分设置了专门的提示。
我还在日记中使用许多提示技巧——我使用常规表格(更扁平且未链接)而不是创建内联数据库,并开始更多地拆分文档,并在我的日记中引用它们。
我有时也会在顶部放置 YAML 前置元数据和描述。这样,如果我想要运行一个 LLM 来处理我的日记——用于总结年份或构建语义搜索——我已经准备好了。(甚至可能将其变成 https://gpt.qalam.dev 的一个功能)
我意识到工具的重要性不如我组织思想的方式。
1 分•作者: merinid•7 天前
1 分•作者: zyh888•5 天前
1 分•作者: mgh2•5 天前
1 分•作者: gpi•6 天前
1 分•作者: empressplay•5 天前
1 分•作者: telui•5 天前
1 分•作者: hakilebara•7 天前
1 分•作者: flipped•7 天前
1 分•作者: bbzjk7•5 天前
1 分•作者: PaperWeekly•5 天前
ElasticMM 是一个新发布的开源服务系统,专为现代多模态大型语言模型(MLLM)设计。该研究成果被选为 NeurIPS 2025 的口头报告。
与主要针对纯文本工作负载优化的现有服务栈(如 vLLM)不同,ElasticMM 引入了弹性多模态并行(EMP),这是一种新的执行范式,可在不同的推理阶段和模态之间调整并行度。
论文的主要发现:
* TTFT(首次令牌时间)降低高达 4.2 倍
* 在混合多模态工作负载下,吞吐量提高 3.2 倍至 4.5 倍
* 模态感知调度、弹性阶段划分、统一前缀缓存和非阻塞编码
论文(OpenReview PDF):
[https://openreview.net/pdf?id=Zd6VyjmN1S](https://openreview.net/pdf?id=Zd6VyjmN1S)
GitHub 仓库:
[https://github.com/hpdps-group/ElasticMM](https://github.com/hpdps-group/ElasticMM)
很想听听 HN 社区的看法,特别是那些构建 LLM/MLLM 推理栈或处理生产环境中多模态服务的用户。
1 分•作者: nomilk•6 天前
1 分•作者: staticshock•5 天前
1 分•作者: Areibman•6 天前
1 分•作者: mhb•7 天前
1 分•作者: harambae•5 天前
1 分•作者: healsdata•5 天前