1作者: dangmanhtruong9 个月前
大家好。我学习深度学习已经有一段时间了,并且尝试实现过CNN、神经网络、U-Net、Transformer等,以此来学习和更深入地理解它们,同时熟悉这些框架。然而,我注意到网上很多教程不够详细,概念解释得不够清晰,导致人们对神经网络的理解不够深入。另一方面,很多资料,比如书籍,可能会展示大量的公式,但没有突出重点,导致读者迷失在数学细节中,阻碍了学习。当我尝试阅读关于RNN或LSTM的内容时,我发现很多教程没有完全解释清楚。有些教程会展示图片以方便可视化,有些会展示前向传播的公式,但没有讨论反向传播的公式。但我认为有一点很少被提及,那就是很多教程,即使展示了反向传播,也仅限于单个RNN层(LSTM/GRU也是如此)。 前段时间,我读了一本名为《神经网络设计》的书,作者是M. Hagan,我发现这本书的解释相当不错(尽管这本书已经不新了)。这本书解释得足够清楚,让你能够构建所有东西,并且不会含糊其辞。当我查看关于RNN的部分时,我注意到这本书解释了如何对具有任意连接的RNN进行反向传播,而不仅仅是单个RNN层,我认为这是很多在线资料没有展示的。这本书还推导了不同延迟的条件,我认为其他资料完全跳过了这一点。 所以我决定动手实现它。URL提供了我的实现链接,其中包括: 该实现包括: - 具有任意循环连接和延迟的RNN网络的完整BPTT - 使用有限差分进行全面的梯度检查 - 贝叶斯正则化和多种优化算法 - 全面的数值验证 我认为在实现过程中学到了很多东西,既学到了如何实现神经网络,也学到了如何构建我的程序等等。我尝试做到系统化,并包含了通过近似差分方程(你懂的[f(x+delta)-f(x-delta)]/(2*delta))来验证反向传播正确性的测试。这还促使我尝试学习爱因斯坦求和(使用Numpy),这确实对事情有很大帮助。在此期间,我还了解到公式(14.39)有一些小错误,在后面的公式中已修复(这已在与作者的私人邮件中得到确认)。梯度检查对于调试这些微妙的数学问题至关重要。 关键经验: - 系统化的软件开发技术,加上数学上的严谨性,有助于更有效地发现机器学习错误。 - 从第一原理开始实现有助于巩固你的理解,并揭示框架隐藏的内部运作机制。 - 爱因斯坦求和是一个很好的方法,可以让数学更简洁。 我知道这个网络已经很老了,但我只是想和大家分享我的经验。总的来说,我认为在跳到更复杂的模型之前,先打好基础是有价值的。
3作者: riddleling9 个月前
开发了一款 iOS 应用,使用 Apple 的 Vision 框架运行本地 OCR 服务器。<p>创建了一个 REST API 端点,网络中的任何设备都可以访问。无需云服务——所有处理都在手机本地进行。<p>已在 App Store 上架(搜索“OCR Server”即可找到)。<p>欢迎大家对该应用的架构提出反馈,或者分享您见过的类似移动端作为服务器的项目。
3作者: moteo_dev9 个月前
一个类似 LMArena 的动态图像对比网站。视频通过 Remotion 渲染。<p>我们希望人工智能能以有趣的方式应用于视频制作,所以我们想尝试用一些现有的模型来制作一些基础的图像。
3作者: itsnebulalol9 个月前
大家好,HN!最近,我们发布了 Nocturne 3.0.0,它完全取代了(现在无法使用的)Spotify Car Thing 原厂固件。我们很自豪能为减少世界上的电子垃圾贡献一份力量。<p># v2 版本的更新 - 用于车载的蓝牙共享网络(无需再在车里放树莓派) - 完整的图形加速 - 原生 Spotify 登录(不再需要客户端 ID/密钥) - 从 Car Thing 启动 DJ - 支持播客 - 手势控制 - 新的设置 - 启动后直接进入“正在播放”界面 - Spotify Connect 设备切换器 - 支持日语、简体中文、繁体中文、韩语、阿拉伯语、梵文、希伯来语、孟加拉语、泰米尔语、泰语、西里尔字母、越南语和希腊语 - 完整的旋钮控制支持 - 支持本地文件 - 支持预设按钮 - 主屏幕上的状态栏(显示时间和蓝牙/Wi-Fi) - 自动亮度调节 - 长按设置按钮进入电源菜单 - 锁屏全屏显示时间(按设置按钮) - DJ 预设绑定(在“正在播放”界面播放 DJ 时,长按预设按钮) - 电台标签页中的 Spotify 混音(每周发现、每日混音等) - OTA 更新 - + 更多(这只是重要的部分!)<p># 刷机 刷 Nocturne 3.0.0 的指南在 README 中。蓝牙开箱即用,或者在“设置网络”部分选择其他方案。需要手机的热点功能和流量套餐才能使用蓝牙。<p># 备注 如果没有我们的捐助者和 Nocturne 团队其他成员,这一切是不可能实现的。我们希望您会喜欢它,因为我们为此花费了数千个小时!<p>如果您可以,请考虑给团队买杯咖啡 <a href="https:&#x2F;&#x2F;usenocturne.com&#x2F;support" rel="nofollow">https:&#x2F;&#x2F;usenocturne.com&#x2F;support</a><p><a href="https:&#x2F;&#x2F;github.com&#x2F;usenocturne&#x2F;nocturne&#x2F;releases&#x2F;tag&#x2F;v3.0.0" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;usenocturne&#x2F;nocturne&#x2F;releases&#x2F;tag&#x2F;v3.0.0</a>