1作者: qianjin197915 天前
Hi HN, 我开发了“疯狂动物城 OC 创作器”,这是一个小型 AI 工具,用于创作受迪士尼《疯狂动物城》启发的原创角色。 这个想法源于我看到许多粉丝喜欢围绕《疯狂动物城》进行世界构建、同人小说、角色扮演和概念艺术创作,但他们不一定具备绘画技能。这个工具可以让你描述一个角色(物种、职业、性格、区域、氛围),然后它会生成一个视觉上符合该宇宙的《疯狂动物城》风格的原创角色。 链接: <a href="https:&#x2F;&#x2F;aiocmaker.com&#x2F;oc-maker&#x2F;zootopia-oc-maker" rel="nofollow">https:&#x2F;&#x2F;aiocmaker.com&#x2F;oc-maker&#x2F;zootopia-oc-maker</a> 功能: * 生成《疯狂动物城》风格的动物原创角色(警察、平民、表演者、黑客、记者等) * 支持各种物种和城市角色 * 视觉风格灵感来自《疯狂动物城 1 & 2》,但角色完全原创 * 适用于同人小说、漫画、角色扮演、故事板创作,或者仅仅是创意娱乐 开发原因: 大多数 AI 图像工具都非常通用。我想尝试一个主题明确的 OC 创作器,它能理解特定宇宙的基调、比例和个性风格,同时仍然鼓励原创角色,而不是复制现有角色。 技术说明: * 基于提示的图像生成,带有风格约束 * 侧重于富有表现力的面部表情、身体比例和电影般的灯光效果 * 不复制受版权保护的角色(设计上仅限原创角色) 这仍处于早期阶段,并且很大程度上是一个实验。我希望从 HN 获得关于以下方面的反馈: * 用户体验 / 提示流程 * 它对创意工作的实用性 * 其他主题 OC 创作器的想法 很乐意回答问题或分享更多细节。感谢您的关注! — 《疯狂动物城 OC 创作器》的开发者
1作者: Zavora15 天前
大家好! 我很高兴分享 ADK-Rust - Google Agent 开发工具包 (ADK) 的 Rust 生产就绪实现。 为什么选择 Rust? 在 zavora.ai 使用 adk-python 广泛开发 AI 智能体工厂后,我希望将同样的强大智能体开发模式带到 Rust 生态系统中,目标是满足以下用例: * 性能至关重要 - Rust 的零成本抽象和内存安全 * 部署大小很重要 - 单个二进制文件,没有运行时依赖 * 系统级集成 - 嵌入式系统、边缘计算、物联网 * 大规模并发 - Rust 的 async/await 与 tokio 功能 ADK-Rust 尽可能与 Python ADK 保持 API parity: * 模型无关 - 支持 Gemini、OpenAI、Anthropic、DeepSeek * 多种智能体类型 - LlmAgent、SequentialAgent、ParallelAgent、LoopAgent * 工具支持 - 内置工具(Google 搜索、代码执行)+ 自定义工具 * MCP 支持 - 模型上下文协议集成 * 会话和内存 - InMemorySessionService、DatabaseSessionService * 流式传输 - 完全支持流式传输,实现实时响应 * 遥测 - OpenTelemetry 集成,用于跟踪/指标 * A2A 协议 - 智能体间通信 快速示例 ```rust use adk_rust::prelude::*; #[tokio::main] async fn main() -> Result<()> { let agent = LlmAgentBuilder::new() .name("my_agent") .model(GeminiModel::new("gemini-2.0-flash")?) .instruction("You are a helpful assistant.") .build()?; let response = agent.run("Hello!").await?; println!("{}", response); Ok(()) } ``` 链接 * Crates.io: [https://crates.io/crates/adk-rust](https://crates.io/crates/adk-rust) * 文档: [https://docs.rs/adk-rust](https://docs.rs/adk-rust) * 网站: [https://adk-rust.com/](https://adk-rust.com/) * GitHub: [https://github.com/zavora-ai/adk-rust](https://github.com/zavora-ai/adk-rust) 期待反馈 我很乐意听取社区的意见: * 您会优先考虑哪些智能体特性? * 对贡献或测试有兴趣吗? * Rust 实现有价值的用例有哪些? 这是一个独立的社区项目,并非官方隶属于 Google,但旨在与 ADK 生态系统兼容。 感谢阅读!
1作者: galaxyeye15 天前
Hi HN, 我想分享一个我们一直在开发一段时间的开源项目:<i>Browser4</i>。 这个项目的动因源于一个反复出现的困扰:大多数浏览器自动化工具(Playwright、Selenium、Puppeteer)非常适合<i>人工编写的脚本</i>,但在用作<i>AI智能体的核心执行层</i>或在高并发场景下时,就会开始出现问题。 因此,我们没有选择“再做一个Playwright的封装”,而是尝试了不同的方向: <i>设计一个将AI智能体作为第一公民的浏览器引擎。</i> ### 什么是Browser4 Browser4是一个基于<i>原生Chrome DevTools Protocol (CDP)</i>构建的浏览器自动化引擎,重点在于: * <i>协程安全的并发</i>(设计用于并行运行多个浏览器会话) * <i>面向智能体的API</i>(导航、交互、提取作为可组合的动作) * <i>混合提取</i>:ML智能体驱动的提取 + LLM提取 + 结构化选择器 + 类SQL的DOM查询语言 (X-SQL) * <i>低级别控制</i>,没有Playwright风格的抽象开销 它使用<i>Kotlin&#x2F;JVM</i>编写,主要是因为我们需要可预测的并发行为和在高负载下的长期稳定性。 该项目完全开源(Apache 2.0 许可证)。 ### 它<i>不是</i>什么 * 它不是Playwright的直接替代品。 * 它不是一个无代码RPA工具。 * 它不是“LLM魔法”——LLM位于浏览器引擎的<i>外部</i>。 Browser4有意保持与浏览器执行层的紧密联系,并将规划&#x2F;推理留给外部智能体循环。 ### 我们正在测试的当前用例 * 大规模Web数据提取 * 智能体工作流程(搜索 → 导航 → 提取 → 总结) * 频繁回访的价格&#x2F;内容监控 * 高并发爬取,其中浏览器启动和上下文切换是瓶颈 在单台机器上,我们可以维持<i>非常高的每日页面访问量</i>,尽管我们仍在验证不同工作负载的基准测试结果。 ### 待解决的问题(我希望得到反馈) * 对于智能体系统,完全绕过Playwright并更接近CDP是否有意义? * 您认为目前将LLM与浏览器自动化结合时,最大的痛点是什么? * JVM在这里是一个合理的选择吗,还是Python仍然是更好的权衡,尽管存在并发限制? * 您希望在为AI智能体构建的浏览器引擎中看到哪些抽象? ### 链接 * GitHub: <a href="https:&#x2F;&#x2F;github.com&#x2F;platonai&#x2F;browser4" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;platonai&#x2F;browser4</a> * 网站(简要概述): <a href="https:&#x2F;&#x2F;browser4.io" rel="nofollow">https:&#x2F;&#x2F;browser4.io</a> 欢迎回答技术问题或听取批评——特别是来自正在生产环境中运行浏览器自动化或智能体系统的人。 感谢阅读。