最新

Show HN: 展示用于（机器学习）Monopoly Deal 的系统与算法

1 分•作者: willwolf•8 个月前

斯蒂芬·霍金与人工智能热潮的兴起

1 分•作者: wslh•8 个月前

从社交媒体视频获取新闻会加剧阴谋论思维

1 分•作者: reaperducer•8 个月前

助理总检察长盖尔·斯莱特的反垄断演讲，圣母大学法学院

1 分•作者: 1vuio0pswjnm7•8 个月前

太平洋过热，秋天感觉像夏天

2 分•作者: colinprince•8 个月前

使用 QLoRA 在双 Pascal GPU 上运行 350 亿参数的 LLM

1 分•作者: rickesh_tn•8 个月前

Hi HN，我构建了一个系统，使用多 GPU 内存溢出，在较旧的 Pascal GPU（P100 + GTX 1080 Ti）上运行 350 亿参数的语言模型。问题：大多数 LLM 推理工具（Ollama、LM Studio）仅限于单个 GPU VRAM（在 16GB GPU 上最多 130 亿模型）。如果你有多个较旧的 GPU，第二个 GPU 就会闲置。解决方案：多 GPU + CPU 内存溢出，采用 QLoRA 4 位量化。该系统会自动将层分布在 GPU0 → GPU1 → CPU RAM 上，从而在通常最大只能运行 130 亿参数的硬件上实现 350 亿参数的模型。基准测试（P100 16GB + GTX 1080 Ti 11GB）： - Qwen-14B：每秒 13.7 个 token（9.4GB VRAM） - OPT-30B：每秒 5.4 个 token（15.2GB VRAM） - CodeLlama-34B：每秒 0.8 个 token（16.7GB VRAM）快速开始： ```bash docker pull rickeshtn/large-model-international_release:latest docker run -it --rm --runtime=nvidia --gpus all --ipc=host --ulimit memlock=-1 --ulimit stack=268435456 -v $(pwd):/workspace -e HF_HOME=/workspace/model_cache rickeshtn/large-model-international_release:latest python /app/interactive_chat.py --model-name Qwen/Qwen2.5-14B-Instruct ``` 技术细节： - QLoRA 4 位 NF4 量化（减少 75% 的内存占用） - HuggingFace Transformers + Accelerate + bitsandbytes - 自动设备映射，带有 CPU 卸载 - 具有对话持久性的交互式聊天 GitHub：https://github.com/rickeshtn/locallm-pascal Docker Hub：https://hub.docker.com/r/rickeshtn/large-model-international_release 已有 34 位用户正在运行。很乐意回答技术问题！

推理提升搜索相关性 15-30%

1 分•作者: JnBrymn•8 个月前

美国宇航局的朱诺号探测器正在环绕木星运行，但它可能已经结束任务了，目前无人可以确认。

1 分•作者: perihelions•8 个月前

罗宾·威廉姆斯女儿呼吁粉丝“停止给我发用AI生成的父亲视频”

5 分•作者: zerosizedweasle•8 个月前

人工智能行业的“幸运儿”

1 分•作者: zerosizedweasle•8 个月前

斯蒂芬·金论美国梦的脆弱性（2006年）

1 分•作者: wslh•8 个月前

我的老板热爱人工智能。我对此毫无兴趣。

1 分•作者: reaperducer•8 个月前

我花了几个小时脑力劳动，写了一个静态图片库：snig.pl

1 分•作者: wofo•8 个月前

纽约监狱的动荡之年

1 分•作者: petethomas•8 个月前

人工智能热潮依赖循环交易，引发泡沫担忧

1 分•作者: zerosizedweasle•8 个月前

Show HN: Sora 2 API 游乐场

1 分•作者: sshh12•8 个月前

大家好！分享一个快速的、氛围感十足的游乐场，可以通过API使用sora2模型。<p><a href="https://github.com/sshh12/sora-2-playground" rel="nofollow">https://github.com/sshh12/sora-2-playground</a>

当人工智能让你“倒胃口”

1 分•作者: freediver•8 个月前

人工智能应用支出报告

1 分•作者: gmays•8 个月前

“解放他人”：托妮·莫里森的图书编辑生涯

1 分•作者: petethomas•8 个月前

新CBS老板大卫·埃利森会见以色列高级将领，以监视美国人

1 分•作者: Despegar•8 个月前

上一页 1...3555 3556 3557 3558 3559...5106 下一页