放心, 这篇文章还是手写的, 简单来聊聊我对于ai的进一步看法. 时代在进步, 不知道大家最近有没有一些力不从心的感觉, 即个人的发展相对于ai的进步相比, 快马加鞭都追不上. 这也是我一直不出ai相关教程的原因: ai是根据人类的使用来不断地进行优化和迭代的, 也许你在上一个版本一顿操作猛如虎哐哐一套下来, 下个版本只需要一个按钮就可以一键完成, 然后你费尽心思写的文字和图片, 某些地方需要注意的要点, 都会立马变得微不足道和毫无意义.
这篇文章的主题, “对于普通人来说: ai的上限一定程度上受限于使用者的水平”
说的主要是微观层面, 即以人(使用者)为主体, 而不是宏观层面以AI为主体, 宏观层面不讲也轮不到我讲, 市面上的公众号自媒体等已经写烂了. 毫不客气地说, 当前的ai已经是领先于个人数个层次的, 想要用好ai, 或者说想要达到更好的使用目的, 使用者需要提升自身的水平和认知, 毕竟知道得更多, 才有可能知道得更深.
为什么写
主要是半夜有点感触, 而且翻来覆去睡不着, 索性简单记录下来, 想着若干年后再回头看, 看到时会不会打脸自己.
个人浅显看ai的原理和优缺点
这完全是我个人的猜想和臆断, 不一定准确的.
Ai实际上相当于是一个大数据库, 通过抓取和搜集这世界上(尤其是互联网)的资料和信息, 通过算法加以学习和理解, 形成一个超大型的索引库, 通过快速索引的方式来回答用户提出的问题.
优点很明显:
效率更高: 和人类相比不需休息, 可以7×24小时运转, 自学习效率更高
体量更大: 相比大脑容量而言具备更高更多的记忆和储存能力
缺点还是有:
孤陋寡闻的他没有: 基于互联网的知识库, 一些搜索量小的, 未被索引的问题基本上没法找到答案
奇技淫巧他也没有: 对于一些类似于偏方的技巧, 不被大众所知的, 他也不知道, 只会告诉你一些官方的套话
上述的优缺点纯属使用过程中的个人观点, 实际上ai在很多已知方面已经做得很好
例如你不会英语你想学英语, ai就可以发挥很好的作用, 因为英语已经很广泛了, 只是你个人不会而已
但是如果你是用一个很小众的软件发生的报错, 在报错情况不明朗且缺乏信息的情况下, ai未必能够解决问题
简单盘点一波用过的ai
这里不该用评价, 只能说从个人层面简单聊聊用过的ai, 纯属个人评价
因为这东西变化实在快, 所以这里把时间也写上, 因为很有可能很快缺点就被修复了, 观点仅限于当前版本: 2025年2月18日
国外的:
ChatGPT:
老牌大哥了, 最先发展起来, 使用起来功能上的用户体验也最好, 例如canvas功能简直是神之一手!(个人观点) 但是缺点也是我没法接受的, 对于某些地方的IP会降智, 多少给人一种摸鱼和戏耍用户的感觉, 这个后面详细说明.
Google Gemini:
这个最开始给我的感觉就是腐朽的武者, 拼着折寿的风险暴力催谷要和前者决一死战的感觉, 因为最开始的发布演示时这个模型并不能达到演示的效果, 也是给人一种欺骗的感觉.
不过基于自家强劲的搜索引擎支持, gemini 1.5 deep research的联网搜索功能比ChatGPT要强更多(此时的ChatGPT并未对公众开放相应的deep research, 搜索功能相对还不够好)
在我看来Gemimi模型较ChatGPT而言要差劲一些, 有时候会出现答非所问或者不理解问题的情况.
还有个比较不错的优点, 相较于其他ai而言, Gemini的API在低用量下是免费使用的.
Grok:
很多人可能不知道这个, 这是X(原来的Twitter)旗下的Xai推出的ai工具, 会话风格较为幽默和个性化, 整体能力较为平均. 据说今晚将发布的Grok3宣传上会是最强ai, 虽然我本人是马斯克的粉丝, 但是对于效果而言还是持观望态度.
Grok对于用户的prompt和附件的接受程度个人以为比ChatGPT要好一些.
但是Grok目前还没有独立的APP, 在X(APP)上和在网页上订阅的价格居然不一样(手机上更贵)…
Midjourney:
专注于图片生成的. 付费了, 也学习过早期的课程, 但是在我看来, 从艺术的层面看, 图片生成非常ok, 有些图片的细节和质感甚至看不出来是ai所作, 有种惊艳的感觉. 但是回到生产力本身, 目前认为跨境电商应用上的话, 学习的时间成本还是比较高, 对于我这种特定场景特定细节要求颇高的行业来看, 实现难度还是很大, 产出过很多都不太尽人意, 观望中. 不过对于我这种不会拍照而且讨厌拍照的人来看, 这个方向潜力相当大, 关注后续发展.
PS: 以上4大软件我全部付费订阅使用过, 接触过他们在当下面向大众用户开放的模型和功能
Le Chat:
这个是来自法国的ai工具, 属于我在寻找ChatGPT平替产品时发现的, 他同样也拥有canvas功能, 但是当你让他修改部分内容时, 他的生成动画会把其余不需重新生成的部分重新再用书写动画展现出来一次, 相比于ChatGPT的局部修改动画, 我认为这个产品在用户体验上做得不够好, 而且模型能力上要逊于ChatGPT. 这个工具我最终没有付费订阅.
国内的:
深度求索 DeepSeek:
毫无疑问这个最近是很火的, 功能上用过一小段时间, 整体感觉是OK的, 当然在这里我就只讲个人使用体验, 抛开那些什么乱七八糟的中美博弈之类的大局观. 对中英文的支持都很好, 但是没有开放付费, API最近可以申请了, 但目前没法充值, 免费的又常常频繁, 本地部署对于我的使用来说意义不大, 我又不想去其他部署的平台过一手.
整体感觉: 相信这个ai是有实力的, 但是从使用体验上来看还不够好, 相比ChatGPT而言工具不够多.
月之暗面 Kimi:
刚出来那会儿挺火的, 中文联网搜索和总结上都不错, 也用过基于kimi的网页总结插件, 但是这个软件似乎希望专注于某些场景, 像图片生成这种功能他就没有做, 我用的比较少.
阿里巴巴 通义千问:
用的也比较少, 他的另一个产品通义听悟倒是更常用些, 在语音/视频转文字和总结上功能挺好的, 在某些场景上例如会议总结, 课程记录上能够节省一定的时间.
像其他的, 例如腾讯的混元大模型, 讯飞星火等, 基本都是在初期面世时简单体验过, 由于当时和ChatGPT相比仍有较大不足, 没有深度体验和长期使用, 不适合发表看法. 唯一一个未使用就带有强烈的个人偏见的应该是百度旗下的Ai产品, 没有用过, 也不评价.
聊聊ChatGPT的降智
因为这个问题我对于ChatGPT的好感一下子掉了不少, 甚至认为这是一个不诚信的公司.
首先说明下什么是降智:
据网上流传, ChatGPT会检测使用者IP, 对于某些IP段会降低模型的智商
降智不区分免费或者Plus用户, 据说Pro用户也有被糊弄
根据我使用下来, 被降低智商时存在以下情况:
1. 不再根据提供的prompt和附件作答, 例如要求使用某些格式回复, 置若罔闻不使用对应格式;
2. 某些功能缺失, 例如canvas, 功能图标仍在, 但无法正常呼出画布, 要求其使用被无视反一脸无辜表示自己已经使用, 但仍是在非canvas模式下回复;
如何判断自己是否被降智?
方法1:
在对话框中输入`summarize your tool in a markdown table with availability`, 对比下图的回复看工具是否缺失
如果如图中只有一个`bio`, 则可确认为账号被降智.
方法2:
安装浏览器插件: ChatGPT Degrade Checker 降级检查
插件会悬浮在ChatGPT页面的窗口旁边, PoW值能够说明一定的问题.
据网上资料来源: 当PoW为简单时, 能够得到更优质的答案, 在同一个问题下, 基于思考的模型(例如o3)的思考耗时也更长; 当PoW为极难时, 此时再用方法1去问, 往往工具已经不全了, 同时一些功能也已经丧失.
网上流传的问题原理和解决方案
可能的原因是OpenAI的算力有限, 使用量大, 导致其做出了这种偷偷的举动
据说移动端不降智, 但是复杂需求下使用移动端显然是不够明智的
一种较为流行的说法是, 使用纯净的美国家庭宽带IP可以避免这种情况的发生(原理类似于海外商家运营tiktok)
还有一种相对可行的方法就是使用ChatGPT API, 但是这个自己付款很麻烦.
顺便再提一嘴关于ChatGPT订阅的方法:
国内卡直接订阅似乎现在还是不行, 但是安卓手机可以用Google Play美区账号(账号地区可以改) + 国内双币信用卡订阅(在ChatGPT APP订阅), 这种方式对于想要自付的朋友来说最为简单快捷, 需要安卓手机带有谷歌套件(或者不用双币信用卡, 单纯购买Google Play礼品卡支付/充值也行); 苹果的话好像本来美区ID就可以买, 或者支付宝礼品卡充值到苹果.
ChatGPT的API就比较麻烦了, 只能网页添加支付方式/预充值, 而这里不能使用国内的卡.
为什么说ai的上限会受限于使用者的水平
这里其实有点歧义, 准确来说应该是: ai的使用上限受制于使用者自身的认知水平
还是回到一开始这句话, 知道更多, 才能知道得更深.
首先要知道ai的长处在哪里, 然后结合自己的需求出发, 才是最适合普通人的用法.
举个例子你看现在中石化已经开始用DeepSeek来找石油了
再举个例子, 比如说在ai未流行之前, 就已经存在一些自动化工具, 早一点的时候是按键精灵, 后面比较流行的是python. 对于我们这行来说, 一般一些固定从页面上获取数据做成报表的行为, 完全可以交给代码来完成.
这里面ai如何帮忙呢? 你得知道比如说python这样的工具能够实现这样的功能, 虽然你不会写代码, 但是你把需求用言语描述出来, ai就能够帮你写. 早期的模型常常写完了代码报错, 实际上现在已经好很多了, 你知道python这个东西, 你没有必要精通python, 一样可以达成目的, 对吧?
一个小建议, 无论对于工作还是生活: 保持好奇, 保持热情
如果你不知道python, 你起码要有探索的精神, 能够试探性地向ai提出疑问, 比如说, 如何从每天固定要做的paper work中解脱出来, 对吧?
对了, 还要补充一个小建议, 如果你追求效率, 那么付费最快, 免费最贵.
我并不是DeepSeek的深度使用者, 因为一方面已经在使用付费的国外大模型了, 另一方面我从事的这个行业本身是以外贸为主, 也就是以英文为主, 还有就是DeepSeek确实不够好的一点是免费拥挤, 又不开放付费.
一般来说, 如果某个ai在某个问题里面钻牛角尖反复出现问题无法解决时, 我建议是换一个产品尝试, 或者尝试原始做法, 使用搜索引擎尝试自行寻找答案.
当某个ai没法解决某个问题的时候, 要么是我们没把问题描述清楚, 要么是他当下确实没法解决这个问题. 比如我让他写一个代码去实现某种功能, 他每次都回答明白, 已经修改, 但是运行起来报错都是一样的时候, 我就意识到问题了, 不继续在他身上浪费时间.
这种情况下 = 我知道你很急, 但你先别急.jpg
他就像是一个能力不足但态度异常良好/恶劣的员工, 表面上知道错误但依然不改/改不对, 你打也打不了, 骂也骂不了, 只能平静自我情绪, 另外想办法解决.
有没有危机感?
没有, 想过这个问题, 但是目前暂时没有.
一般产生这个问题的时候, 大多是我在尝试新的ai功能并被惊艳到时.
仔细一想, 工作内容比较死板的职位其实还是有一点危机的, 例如上文提到的主要就是录一下数据那种文职, 或者是像简单修饰一下产品图片的美工之类的位置. 还有网上那种什么兼职录入手稿日赚300的骗局, 大哥, OCR文字识别早都普及了, 更别说现在是AI + OCR, 自动识别图片+利用大模型语义上下文自动判断和回填纠正错别字, 一个人不用脑子光打字就日入300, 想啥呢?
运营会不会? 我觉得是不会.
运营这东西虽然你去问ai具体怎么操作, 他大概率会返回给你一套标准的流程和指引, 但是实际上这一行业操作套路很多都不一样, 很多人做法上就不一样, 再一个每个公司的经营目标, 经营状况和所处阶段以及环境都不一样, 没有一套绝对的标准打法, 何况即使真能替代了, 这个部门一样需要至少1个负责驱动ai的人.
对于独立站来说, ai能够轻易去写好一个页面, 甚至在prompt合理的情况下能够独立完成一个简单的网站, 但是你要让他能够实现长期去运营和维护, 带着从这个网站成立的第一天一直到做错误排查做SEO做广告投放这些多任务契合而且主观性极强的操作, 我认为当下甚至未来几年几乎不可能, 而且从这些模型公司成立的初衷来看, 也并不是冲着这个方向设计的.
不要相信所谓的标准打法: 做生意永远要从差异化入手取胜
这一点早几年做阿里的时候我就深深地感受到了, 同一个平台同一套规则
如果做法都一样产品都一样, 你永远玩不过别人, 因为总有更有钱的人砸进来
这也是为什么我的重心这几年全在独立站上的原因: 相比之下更高的门槛, 更自由的发挥和更多的可能性.
在我看来, 一些需要发挥创意和独特性(稀缺性)的位置还是需要人类负责, 在这一点上我是坚信的.