GPT – 落园

被归纳迭代统治的世界

在这个AI快速改变世界的时代，园主已经从一开始被GPT表现出来的潜在智力的震撼，到现在对于层出不穷的图像视频音频AI工具有点审美疲劳了。去年的时候和朋友们感慨，在归纳和演绎之间，这个阶段归纳的力量远远超越了演绎。算力的突破仿佛像《三体》中描述的突破智子封锁一样，让可以被计算改进的模型都深深享受着巨量数据带来的断层优势，层出不穷地展现着未来的可能性。

AI模型之外，很多产业也都被基于数据的归纳和快速迭代逐渐颠覆着。shein在快时尚的成功，是千千万万的时尚元素排列组合迭代出来的。时尚爆款可能是玄学，但只要样本量足够大、选择足够多，就一定会出现几个爆款，然后只要快速跟进就可以吃到一波流量红利。类似的玩法不仅仅局限于快时尚，但凡是“义乌制造”可以连夜复制出来的消费品，都可以用这个打法。譬如手机壳，原型相对固定，考验的是设计师的创意和流行元素变化。看一个纪录片说，人们平均一个月换一个手机壳（可能是北上广的消费数据），那么消费者对于新意的渴望就成为显而易见的需求。

从文字，到图像，到视频，到落地成为一件工业制造品，快速迭代的可能性充分地考验着人们的贪心。行业之中的人们各司其职，努力地优化着每一个可以减少成本或者提高效率的环节。那些看似玄学的艺术和非理性，最后也没敌过归纳和迭代的降维打击。

毁灭吧，消费主义快点变回极简主义吧，要不园主实在是跟不上这个光怪陆离的世界了。毕竟这人脑子还是习惯基于演绎的思考，重新训练到归纳的角度有点超出人脑算力和记忆存储的局限了。以有限对抗无限，怪不得庄子说，

吾生也有涯，而知也无涯。以有涯随无涯，殆已；已而为知者，殆而已矣！

附录：看到一个纪录片《这货哪来的》（B站的？）来的灵感，把这些观察串联了起来。

最近不是在折腾LLM嘛，于是就试了两条路子：用openai的api，以及直接在openai的界面里面创建GPT。

前者没啥特别的，chatgpt的api做的很成熟了，from openai import OpenAI 之后直接在python里面调用几个现成的函数就好了。可选的参数其实也不多，主要就是prompt写的好一点就行。我的要求也不高，试了试基本满足。此外我还用到了微软 azure api，也很方便，两者一结合基本一个app就搓出来了，只是暂时还只能在命令行运行，没写前端ui罢了。

后者就麻烦了。我想着自己写前端ui还挺麻烦的，就想偷个懒直接在GPT里面弄弄看看行不。结果呢，现在这个版本实在是太挫了，只支持最最基本的action，虽然可以调用其他api，但还没研究出来怎么实现用户上传的文件扔到action api call里面。搜了搜他们的论坛也没啥结果，然后心累就到此为止了。

最后贴一下如何在openai 的GPT里面调用azure api。主要是api key那里实在是反用户直觉，我找了好久……一定要选 custom 然后把自定义的名字设为 Ocp-Apim-Subscription-Key 才可以。贴个图。

自定义 action -> authentication -> custom header name

当然azure api的文档做的也很差就是了，经常搜出来的是过时的文档，试一试都是404错误。哎，时间都花在这些琐碎的调试bug上了。

最后的结论是，在现在这个阶段，openai GPT的多模态做的还是太封闭，只适用于比较基础的交互需求，得等到后面允许自定义编程更丰富一些才可以。想做的稍稍复杂一点，写ui是逃不掉的了。web版还可以写个python+js凑和一下（flask这么轻量级的web开发框架真的是效率提升利器），app版xcode看了半天发现也是一等一的复杂……说好的ai改变程序开发呢？叹口气……