实际工作中的POKÉDEX使用CHATGPT来识别POKÉMON
面对现实吧。您点击这篇文章并非偶然。你和我一样是个神奇宝贝书呆子,鉴于我将要向你展示的内容,你完全有理由感到兴奋。一位名叫Abe's Projects 的 YouTuber 决定将一些组件组合在一起,制作一个基本的(但能正常运行的)图鉴,而我无法保持冷静!
这个图鉴的工作原理与原版惊人地相似。依靠 ChatGPT 的功能来识别通过相当基本的相机设置捕获的图像,Abe 的 Pokédex 很好地复制了热门电视剧和书中的原版体验。 Abe 甚至将他的电子设备封装在一个非常怀旧的 3D 打印外壳中,使其与原始图鉴的相似程度达到了不可思议的程度……如果这还不够,他甚至用计算机对图鉴进行了编程,使其能够像原始图鉴一样说话——相当机器人的声音。
这个过程虽然相当复杂,但 Abe 在 YouTube 视频中详细介绍了这一过程。在他公认的更难的建筑之一中,安倍提到了第一个难题——规划外部和内部。问题是,如果不知道内部组件的位置,就无法对外部形状进行 3D 建模,如果不规划外壳,就无法知道内部组件的位置。尽管如此,Abe 设计了一个基本框架,包括外壳、一些可拆卸组件(例如屏幕和按钮的边框)以及“打开”你的 Pokédex 的翻盖。
内部采用 XIAO ESP32S3 Sense 微控制器,该微控制器拥有自己的集成摄像头,连接到黑白 OLED 屏幕(基于 90 年代的 Pokédex 玩具)、一个连接扬声器的放大器、一组断路器按钮、一块电池,以及一个 USB-C 端口,用于加载运行迷你计算机的所有信息以及为电池充电。
Pokédex 的工作方式相当巧妙——它使用 GPT4 和 PokéAPI,依赖后者的海量信息数据库。 GPT4 为该设备提供了 AI 功能,AI 语音生成器 (PlayHT) 有助于创建 Pokédex 的标志性声音效果。他们协同工作,首先识别神奇宝贝,其次参考数据库中的信息,第三在屏幕上显示神奇宝贝,最后播放有关神奇宝贝名称、类型、背景和性能的相关音频。然而,这确实意味着 Pokédex 需要始终保持 WiFi 连接,以不断利用 GPT4 和 PokéAPI(因为设备本地没有任何反应)。
然而,整个过程也并非没有问题。问题始于软件本身,它会挂起、崩溃,有时会因为必须完成的繁重工作而负担过重。与此同时,PlayHT 音频生成器也提出了自己的问题,例如人工智能说话时在后台播放令人讨厌的滴答声。 Abe 在视频的专门部分提到了他遇到的所有问题,还概述了他如何解决这些问题(提示:大量编码)。
版权声明:本文由用户上传,如有侵权请联系删除!