1作者: thebbapp6 个月前
在博客时代,WordPress 让建立网站和发布文章变得轻而易举。 许多年过去了,还没有出现类似 WordPress 的应用程序。<p>我创建了 BbApp 框架,让您免于在为 WordPress 构建一个非常昂贵的应用程序的重复性工作中耗费数月的时间。<p>它包括一个 XCode 项目模板和数十个框架,将它们连接在一起,为应用商店的审核做好准备。<p>您可以单独使用 BbApp 与 WordPress 或 BBPress。 要享受功能齐全的本地应用程序,只需下载、在 XCode 中构建并发布即可。<p>它还包括开源 PHP 库,使您能够轻松地将现有的原生移动应用程序与 WordPress 集成。<p>功能<p>- 即时文章加载 - 访客推送新文章和评论的通知 - 无限滚动 - 访客文章 + 评论(仅限 BBPress) - 访客评论(WordPress 和 BBPress) - 多个文章类别(仅限 WordPress) - 离线模式 - 标记已读/未读 - 深色模式 - 深度链接 - “安装”网站应用横幅<p>平台<p>- iPhone、iPad (iOS) - Macbook、Mac Mini、iMac (macOS) - Apple TV (tvOS) - Android (计划中)<p>包含内容<p>- XCode 模板项目 - 40 多个 Swift 6 和 @Observable XCode 框架,附带 API 文档 - WordPress 插件 (PHP 7.2.24+) - 20 多个轻量级和模块化的 PHP 库
1作者: AmbroseBierce6 个月前
NotSoAAA 是一个在 Steam 上寻找评价较少但评价积极的游戏的网站(默认情况下,它会显示评价少于 42 条的游戏,但用户可以选择最多 100 条),因此它为那些可能值得更好评价的游戏提供了一个机会!用户可以将鼠标悬停在任何游戏上以观看该游戏的预告片。<p>一开始,用户可以通过选择他们喜欢的热门游戏来筛选游戏,这样网站就会尝试找到类似的游戏,或者他们也可以直接滚动浏览所有游戏。<p>另外值得注意的是,在滚动浏览了几款游戏后,会出现另一个部分,允许用户按标签筛选,用户可以选择多个标签,或者他们可以忽略它并继续滚动以继续查看基于现有筛选条件的游戏。<p>最初,我尝试从 Steam 上抓取所有游戏,但它们在几百个请求后就会限制此类尝试,所以我一直在寻找替代方案,并在 Kaggle 上找到了一个非常好的数据集,所以我使用了它,你可以在 `fronkongames/steam-games-dataset` 中找到它。<p>该网站使用原生 JavaScript,后端使用 PHP 进行模板处理,使用 Python 进行所有抓取和脚本编写。<p>欢迎任何反馈或问题。<p>更多技术见解(AI 生成):<p>- 混合过滤管道结合了 JSON 支持的数据集和会话级排除,以保持每个访问者的推荐内容的新鲜度。 - 使用单个可重用的 &lt;video&gt; 元素,由 dash.js/Hls.js 管理,以最大限度地减少在预览多个卡片上的预告片时的内存消耗。 - 实现了动态批处理以及滚动节流的无限加载,并带有服务器端会话跟踪,以避免在请求之间重复游戏。 - 在 PHP 和前端滑块之间共享筛选器状态,包括自定义评价/价格范围,这些范围通过可中止的 fetch 调用触发服务器重建。 - 使用 Python 脚本规范化抓取的 Steam 数据,这些脚本添加派生元数据(标签、类似游戏、应用程序 ID),并在发布前积极去重条目。 - 通过 ffmpeg 剪辑 MPD 流、叠加游戏标题并自动标记已处理的条目以防止重复使用来生成视频合集。 - 自适应用户体验在标签和“类似游戏”发现模式之间切换,并在精选推荐激活时自动禁用标签筛选器。
1作者: platypii6 个月前
我在 Apache 邮件列表上问过这个问题,但还没有找到好的解决方案。想知道是否有人对如何实现这个目标有一些想法? 我的问题是:我在 S3 中有以 Parquet 格式存储的、大小为千兆字节的 LLM 对话日志。我希望添加逐行的注释(llm-as-a-judge 分数),最好是不触及原始文本数据。 因此,对于给定的数据集,我想添加一个新列。这似乎是 Iceberg 的一个完美用例。Iceberg 确实允许你演进表模式,包括添加列。但是,你只能添加带有默认值的列。如果我想用注释填充该列,Iceberg 会让我重写每一行。因此,尽管 Iceberg 基于列式存储格式 Parquet,但我需要重新写入整个源文本数据(千兆字节的数据),仅仅是为了添加大约 1MB 的注释。这感觉非常低效。 我考虑过将该列存储在它自己的表中,然后将它们连接起来。这确实可行,但连接操作使用起来很麻烦,而且我怀疑查询引擎不会很好地优化“基于 row_number 的连接”操作。 我一直在探索使用 Parquet 中鲜为人知的功能,例如 file_path 字段,以将列数据存储在外部文件中。但实际上没有任何 Parquet 客户端支持这一点。 我快要用尽处理这些数据的有效方法了。如果找不到解决方案,我甚至考虑构建自己的表格式。有人有建议吗?