号称 ChatGPT" 最强竞争对手 " 的Claude,今天迎来史诗级更新——
模型记忆力原地起飞,现在1 分钟看完一本数万字的小说,已经不在话下。
(资料图)
消息一出,评论区直接炸了,网友们蜂拥而至,"woc 连连 ":疯了疯了!
事情进展得太快了,又是为人类担心的一天!
原来,这次更新,将模型的上下文窗口token 数提到了足足 10 万,相当于 7.5 万个单词!这意味着,大模型 " 记性 " 不好的缺陷现在得到补强,我们可以直接丢给它上百页上万字的材料,比如财报、技术文档甚至是一本书。
而它都能在一分钟之内帮你分析总结完毕!
要知道,之前市面上几乎所有 AI 聊天机器一次都只能读取有限数量的文本,理解长资料里的上下文关系非常灾难。而我们人类自己去处理大篇幅的文本又太慢了,比如光是要读完10 万 token 的材料,就需要大约 5 个多小时,更别提还要花更多的时间去理解去消化才能进行总结。
现在,Claude 直接一把搞定。
这波,简直是 " 五雷轰顶 "、" 反向开卷 "GPT-4,因为,刚刚后者也不过才做到3.2 万token。
所以,一次性比 GPT-4 多出 3 倍的处理量,Claude 效果提升究竟如何?Claude 重磅更新:一次记忆 10 万 token
据 Anthropic 官方介绍,升级后的 Claude-100k 版本,对话和任务处理能力双双得到极大提升。
一方面,是 " 一次性可处理文本量 " 的增加,直接拓宽了 Claude 的可从事岗位类型。
之前,大模型最多用来处理个几十页的文档。
现在,Claude 已经能速读公司财报年报、技术开发文档、识别法律文件中的风险、阅读上百页研究论文、乃至于处理整个代码库中的数据。
最关键的是,它不仅能通读全文总结其中的要点,还能进一步完成具体任务,如写代码、整理表格等。
例如,快速理解几百页的开发文档,并根据文档开发应用程序 demo。
以 Claude 之前没见过的一项新技术 LangChain 作为示例:
当交给它一个240 页的 LangChain API 报告后,要求它快速给出一个 LangChain 的 demo 演示:几乎没用多少时间,Claude 就快速给出了一个基于 LangChain 开发的应用程序 demo:又例如,甩给它一个漫长但又不得不听的5 小时知识播客:它不仅能将重点转成文字提取出来,还能快速整理表格,对观点进行分析:难度增大一点,30 页的研究论文也能很好地处理,甚至能准确指定它整理某一章节的某一段落:除此之外,还能帮导演处理剧本选址一类的问题。如给出《沙丘》的电影脚本,问 Claude 最适合拍摄的地点,它很快就能给出几个对应的参考地址:最后,官方还给出了一个《了不起的盖茨比》案例,虽然没有 demo 演示。他们将这篇喂给 Claude 后,替换了其中一个角色 Mr. Carraway,把他的角色变成 "Anthropic 里的一位工程师 ",再交给 Claude 阅读,让它找不同。
几乎只用 22 秒钟,Claude 就读完这本书,并发现了 Mr. Carraway 的 " 不同身份 "。
另一方面则是 " 记忆力 " 的增加,带来了对话题掌控度的提升、以及聊天能力的提升。
此前大模型经常会出现 " 聊着聊着忘了话题 " 的情况,对话窗口总字数超过几千字后,开始胡言乱语。
举个栗子,如果你用大量提示词设置了一个 ChatGPT 版猫娘,那么它开始聊天后,可能几个小时就忘记了自己和你说过的话,开始表现出一些 " 出轨 " 的迹象(手动狗头)
但现在,拥有一次 10 万 + 个 token 记忆力的 Claude,则不太可能出现这种情况,反而能牢牢记住和你聊过的话题,连续交谈上好几天。那么,目前我们能通过什么方式用上最新版 Claude 呢?
API 和网页版均已上线
Anthropic 先是宣布推出了 Claude-100k 的 API 版本,之后又火速上线了网页端。
△Anthropic 工程师所以无论你是用网页端还是用 API,目前都已经可以直接体验这个拥有 " 超长记忆力 " 的 Claude 版本。
很快啊,已经有网友迫不及待玩上了。
像 OthersideAI 的 CEO Matt Shumer,就试用了一下网页端的 Claude-100k 总结技术报告的效果。
他先测了波Claude-9k的效果,发现它面对长达上百页的 GPT-4 技术报告,还是会出现 " 幻觉 ";随后测试新版Claude-100k,发现它给出了有理有据的估计:
GPT-4 的参数量级大约在5000 亿左右!
这是它的推测过程:不知道这波 OpenAI 的奥特曼会不会出来辟谣(手动狗头)。还有一位 Assembly AI 的老哥,测试了一下 Claude-100k 的API 版本。
在视频演示中,他用 Claude-100k 总结了一下 Lex Friedman 的5 小时长播客(内容与 John Carmack 有关),效果看起来也非常不错:
但无论是网页版还是 API,都还不是我们能免注册直接试玩的版本。之前我们说的不用注册、不用申请、不用 " 骚操作 " 就能玩、体验也很不错的是slack 端,它的添加方法我们在之前的文章中介绍过,非常简单。
遗憾的是,目前它还是 Claude-9k" 体验版 "。
所以,总结一下就是,这个 Claude-100k 的版本:可以用 API 的方式体验,不过不是免费的;
网页版也行,但需要你有试用资格,没有就去申请,等一等;
Slack 端还不行,只是个体验版。
反向开卷 GPT-4,网友:卷对了方向昨天,谷歌刚刚在 I/O 大会上宣布了数项重大更新,包括:
重构谷歌搜索、开启 AI 对话
发布大模型 PaLM 2
全面开放 Bard,不用排队直接玩
……
这被视作针对微软和 OpenAI 的一系列反击。
现在,来自 Anthropic 的 Claude 紧随其后,发布如此重大更新,直接反向开卷 GPT-4 ——有网友评价:
Claude 卷对了方向。
确实,目前大部分语言模型普遍都只能处理 2-8k 的 token 量,大家都在苦苦追寻提高模型记忆力的办法。比如上个月那篇可将 Transformer token 上限扩展到 100 万甚至 200 万的论文就引起了非常大的关注,不过网友测试效果似乎不太理想。
现在,Claude 直接 " 业内第一人 " 宣布做到了 100k,并拿出来给大家用,很难不让人称赞。除此之外,还有网友 " 站得更高 ",称:
资本主义之间的竞争果然很美妙。
言外之意,卷得好啊卷得妙。没有巨头和各垂直企业之间的你争我抢,我们哪能在短短两天之间又目睹了如此多和重大的进展呢?诶,不过话说回来,鉴于 Anthropic 是由当初不满意 OpenAI 与微软走得太近的几位前员工创立,而谷歌也斥资 3 亿美元投资了这家公司。大胆猜测:
这次两人前后脚的 " 一唱一和 ",是不是提前商量好的?
参考链接:
[ 1 ] https://techcrunch.com/2023/05/11/anthropics-latest-model-can-take-the-great-gatsby-as-input/
[ 2 ] https://twitter.com/AnthropicAI/status/1656700154190389248
[ 3 ] https://www.anthropic.com/index/100k-context-windows
[ 4 ] https://twitter.com/mattshumer_/status/1656781729485529089
[ 5 ] https://www.youtube.com/watch?v=2kFhloXz5_E
标签:
号称ChatGPT最强竞争对手的Claude,今天迎来史诗级更新——模型记忆力原地起飞,现在1分钟看完一本数万...
光明网讯(记者李汶键赵艳艳)“运河两岸的人们离不开大运河的水,拜年都是挑着水去。想把大运河的故事...
云南部分地区迎来降雨气象干旱将有所缓解---昨天(5月11日),云南部分地区迎来降雨,近来久旱、晴热少雨的
下一步,巫山县农业农村委、龙溪镇政府还将携手重庆荣亘农业开发有限公司,对龙溪18老鹰茶进行整体的品牌运
ST天润00211305月11日在投资者关系平台上答复了投资者关心的问题投资者贵司的网约车新能源汽车项目可以公告
5月10日,国家艺术基金2020年度艺术人才培养资助项目《应用数字技术的水墨动画人才培养》师生作品展,于北
为按照四川省总林长令(第2号)、成都市林长令(第2号)工作要求,全面提升武侯区园林绿地夏季汛期防火防汛
谷歌在I O开发者大会上宣布推出最新的大型语言模型PaLM2,向OpenAI的GPT-4等竞争对手发起挑战。谷歌表示PaL
扎波罗热很可能成为乌军的第一个主攻方向。在扎波罗热,乌军集结了7万精锐部队,举行了一场大规模的誓师大
直播吧5月11日讯 今日LPL官方解说管泽元、WaWa采访腾竞高层,带着网友质疑拷打为什么十周年盛典FPX被“区
1、抖音五块钱如何花三天什么梗2、五块钱如何花三天呢?多读书,多看报,少吃零食,多睡觉~3、抖音五块钱如
➤➤天津资格型人才落户落到房产上需要什么资料?答:天津资格型人才落户落在本人、配偶、父母、子女名下房
1、管理会计职能是预测、决策、组织、规划、控制和评价等职能。2、五大职能具体如下:1 预测经济前景;2 参
佳力图(603912)05月11日在投资者关系平台上答复了投资者关心的问题。
随着夏季的来临,天气逐渐变热,防溺水工作再次牵动着学校、家庭和社会的“安全神经”。为切实做好鹤壁...
洛阳三日游最佳路线洛阳作为一个悠久的古城之一,三日游的最佳路线则是白马寺、洛阳老街、中国国花园、龙门
最近,跌势汹汹的MLCC市场似乎变了风向。国内MLCC大厂三环和风华高科,在近期分别发布了涨价信息:三环表示
中新网重庆5月11日电(梁钦卿)2023年5月11日上午,重庆市高级人民法院对张波、叶诚尘故意杀人上诉一案进行二
很多人日常打开支付宝,想进行还贷款服务,却猛地发现:来分期不见了。那么,来分期去哪儿了呢?来分期消失
5月4日至5月6日,甘肃交通职业技术学院汽车工程系举行了校园系列专场招聘会,其中线上招聘会共计2场,线下
X 关闭
X 关闭