10作者: pigcat30 天前
这是我们新的文本到图像模型:一个完全从头开始训练的 9.3B 单流扩散 Transformer。 我们非常注重通过结构化的 JSON 提示实现可控性,包括强大的文本渲染、通过边界框引导的空间感知以及调色板控制。 它拥有我们迄今为止测试过的所有开放权重模型中最好的文本渲染效果,并且 NF4 量化检查点可以在单个 24GB GPU 上运行。 有关更多技术细节和示例,请参阅我们的博客文章:https://ideogram.ai/blog/ideogram-4.0/ 我们很乐意回答任何问题 :)
2作者: speckx30 天前