1 分•作者: mimixbox•7 个月前
我用 Go 语言构建了一组小型工具,构成一个三部曲:
* fileprep — 使用结构体标签进行预处理和验证(修剪、替换、规范化等)
* fileframe — 一个轻量级、不可变的 DataFrame,用于过滤、映射、分组
* filesql — 直接在 CSV/TSV/LTSV/Excel/Parquet 文件上运行 SQL(底层使用 SQLite)
将它们组合在一起,可以构成一个微型 ETL 管道:读取 → 预处理 → 转换 → SQL 查询。
代码库:
* [https://github.com/nao1215/fileprep](https://github.com/nao1215/fileprep)
* [https://github.com/nao1215/fileframe](https://github.com/nao1215/fileframe)
* [https://github.com/nao1215/filesql](https://github.com/nao1215/filesql)