2 分•作者: hardiksondagar•10 天前
嘿,HN!我开发了这个工具,起因是我的婚礼留下了 5000 张照片需要整理。<p>关键的发现是:照片整理的大部分时间都花在审查近似重复的照片上。专业摄影师会连拍,所以你可能会得到同一个瞬间的 10 多张照片。<p>PicPick 使用 CLIP 嵌入来聚类视觉上相似的照片,然后加入人脸识别以保持分组的连贯性(这样你就不会因为“新娘和父母”与“新娘和朋友”看起来相似而混淆)。<p>技术栈:
- CLIP 用于语义相似度(不仅仅是感知哈希)
- face_recognition (dlib) 用于人物检测
- 在组合特征上使用 DBSCAN 聚类
- FastAPI + 原生 JS 用于 UI
- SQLite 用于所有数据<p>它将我的审查集从 5000 张减少到大约 1000 个聚类,然后我在几个小时内将其筛选到 300 张,用于相册,而不是几天。<p>聚类参数是可调的 - 对于有许多重复的专业拍摄,可以设置得更紧凑,对于休闲照片,可以设置得更宽松。<p>欢迎反馈!特别是关于:
1. 更好的聚类算法(目前是基于 CLIP 嵌入 + 时间戳 + 人脸向量的 DBSCAN)
2. 用于快速审查的 UI 改进
3. 处理没有脸的照片(风景、食物等)<p>完全离线工作,无需上传到云端。