4 分•作者: walz•7 个月前
上个月,我在纽约淋着小雨散步,注意到大约一半的人都撑着伞。几分钟后,雨势变大,撑伞的人数也增加到接近 80%。
这让我开始思考,如果能以某种方式追踪这个现象就好了,所以我做了一个网站!我正在进行人行道直播,将其输入 YOLO 模型进行人物追踪,然后将每个被检测到的人的画面发送给 Gemini 2.0 Flash,它会返回关于每个人衣着以及是否撑伞的结构化 JSON 数据。我还在网站的界面设计上花了不少心思,让它看起来像一个电视天气频道。
我向一些朋友展示了这个项目,有人提到传奇的 Tasks xkcd 漫画 (<a href="https://xkcd.com/1425" rel="nofollow">https://xkcd.com/1425</a>) 现在已经过时了。如果你想检查一张照片里是否有鸟(或者是否有人撑伞),你只需要向一个廉价的视觉模型索要 JSON 数据即可。