1 分•作者: todsacerdoti•5 天前
返回首页
一周热榜
1 分•作者: Pastaza•5 天前
1 分•作者: rramadass•5 天前
1 分•作者: breve•5 天前
1 分•作者: handfuloflight•5 天前
1 分•作者: breve•5 天前
1 分•作者: bookofjoe•5 天前
1 分•作者: doener•5 天前
1 分•作者: kianN•5 天前
1 分•作者: segfault0x23•5 天前
1 分•作者: tccole•5 天前
1 分•作者: hiddenseal•5 天前
1 分•作者: herbertl•5 天前
1 分•作者: Vermin2000•5 天前
1 分•作者: dorongrinstein•5 天前
1 分•作者: lafalce•5 天前
1 分•作者: parsabg•5 天前
嗨,HN,
我们是 Amin 和 Parsa,很高兴与大家分享 DataKit,这是一个完全基于浏览器的、数据分析平台,让您可以在浏览器标签页中直接处理大型数据集,无需服务器、无需设置,并且数据不会离开您的机器。
* GitHub: [https://github.com/datakitpage/datakit](https://github.com/datakitpage/datakit)
* 在线演示: [https://datakit.page](https://datakit.page)
DataKit 使用编译成 WebAssembly 的 DuckDB 在客户端完全处理多千兆字节数据集(CSV、Parquet、JSON、Excel)。您的数据保留在本地浏览器中,默认情况下不会上传到任何地方。
我们对必须在需要上传敏感数据的云工具和安装维护起来很麻烦的重量级本地设置之间做出选择感到沮丧。我们想要一个只需在浏览器标签页中就能运行,但仍然具有真正分析能力的东西。
它的一些核心功能包括:
* 客户端处理大型文件(已测试高达约 20GB),无需后端
* 由 DuckDB-WASM 驱动的完整 SQL 接口
* 通过 Pyodide 进行数据科学工作流程的 Python 笔记本
* 通过代理可选地连接到远程源(Postgres、MotherDuck、S3)
* AI 助手,仅查看模式和元数据——从不查看原始数据
许可:DataKit 采用 AGPL 许可,提供企业使用的商业许可。
在过去的几个月里,我们一直在将 DataKit 作为副项目进行构建,非常希望收到关于以下方面的反馈:
* 您遇到的性能瓶颈
* 您工作流程所需的功能
* 关于全客户端架构与混合方法的看法
感谢您的关注,我们很乐意回答任何问题。
— Amin & Parsa
1 分•作者: type0•5 天前
1 分•作者: doener•5 天前
1 分•作者: gnabgib•5 天前