随着OpenAI推出ChatGPT在人工智能领域掀起的千层浪,生成式AI开始被普罗大众所熟知。《日本经济新闻》在此前报道中指出,全球100多家大规模生成式AI企业总市值达480亿美元,约为2020年的6倍,OpenAI的确引领了市场对生成式AI企业的投资热潮。
实际上,除了OpenAI,AI的发展浪潮中还有Jasper、DeepMind、Stability、Cohere等竞争者。5月3日,《纽约时报》报道称,两名知情人士透露Cohere已获2.5亿美元融资,估值约20亿美元,投资者包括互联网软件巨头Salesforce、芯片制造商Nvidia、多伦多风投公司InoviaCapital和硅谷公司IndexVentures。这是自2022年ChatGPT发布后在生成式AI领域的最新重大投资。而此前,Cohere筹集的总资金已达1.7亿美元,包括2022年由TigerGlobal领投的1.25亿美元B轮融资。
“百舸争流,奋楫者先;千帆竞发,勇进者胜”。作为加拿大的一家初创企业,Cohere何以突出重围,斩获众多投资者的青睐?了解该企业的发展历程、其产品区别于ChatGPT的独特优势后,相信我们会对投融资市场风向的选择理由与生成式AI的发展动向有所理解。
一篇著名的论文
创立于2019年的Cohere是一家自然语言处理(NLP)公司,基于大型NLP模型为外界提供API服务,从而提高计算机理解和生成文本、阅读和写作的能力。该公司由艾丹·戈麦斯(AidanGomez)与两个朋友NickFrosst和IvanZhang一起创办,它的总部位于加拿大多伦多,在美国旧金山、英国伦敦均设有办事处。自合作以来,他们组建了一支约135人的团队,目前还在继续扩建以更好的提供相关API服务。
Azuki Green Beans仅OG可获得,将与动画发布同步使用:6月30日消息,据推特用户CirrusNFT在社交平台发文总结Azuki社区会议内容,Azuki团队表示Azuki动画系列正在制作中,而Azuki Green Beans将与动画发布同步使用,仅OG Azuki可获得。
此前报道,6月28日,据官方公告,Azuki将推出总量为1万枚的新NFT系列GreenBean。[2023/6/30 22:10:01]
两位联合创始人AidanGomez和NickFrosst曾担任过谷歌研究员,其中AidanGomez是大名鼎鼎的《AttentionIsAllYouNeed》论文的作者之一。该论文提出了一种新的、被誉为ChatGPT的“祖师爷”的网络架构“Transformer”,ChatGPT通过Transformer模型进行了序列建模,并通过自回归方式进行训练,使得大语言模型能够根据前文内容和当前输入,生成符合语法规则和语义逻辑的拟人化内容,这使得国内外都掀起了一波未平一波又起的大规模语言模型训练的热潮。
Cohere提供了与ChatGPT类似的产品,目前主要包括:搜索文本、分类文本和生成文本三大类产品,帮助企业快速部署对话式AI聊天机器人、生成式搜索引擎、文本摘要总结、增强向量搜索等,是为数不多在技术层面具备与OpenAI进行竞争的AI企业之一,这也是其受到资本市场青睐的重要原因之一。
彭博社分析师:Grayscale在SEC诉讼中获胜的几率为70%:金色财经报道,彭博资讯高级法律分析师 Elliot Z. Stein 表示,Grayscale 70%的机会在一场重大加密行业诉讼中胜诉美国证券交易委员会 (SEC)。鉴于这种情况,该公司分析师认为比特币现货 ETF 今年在美国获得批准的可能性为 50%。美国证券交易委员会和主席Gary Gensler可能正在准备迎接损失,并希望通过在法院判决之前或大约同一时间批准现货比特币 ETF 申请来先发制人地软化损失或使其变得毫无意义。[2023/6/28 22:05:27]
Cohere曾在2021年9月获得4000万美元A轮融资;2022年2月获得1.25亿美元B轮融资,投资者包括老虎环球基金、“AI教父”GeoffreyHinton、斯坦福大学教授李飞飞、深度学习专家PieterAbbeel等。在2022年10月,Cohere便开始与谷歌、Salesforce、Nvidia进行融资谈判,如今,Cohere获得巨额融资将继续与OpenAI展开激烈竞争,继续加快类似ChatGPT产品的技术创新和更新迭代。
资本为何青睐?
实际上,在OpenAI发布GPT-4之后的一段时间内,大部分人都将目光聚焦于AI大模型,包括Anthropic、AI21、Cohere和Character.AI在内的众多资金充足的初创公司都在投入大量资源来构建更大的算法和模型,以期待努力赶上OpenAI的技术。
CrossTower考虑收购其他加密公司并考虑推出救援风险基金:金色财经报道,加密货币交易所CrossTower首席执行官Kapil Rathi称,正在考虑在竞标加密借贷平台 Voyager Digital 之外进行进一步的收购。?该公司“处于一个很好的位置”来收购拥有良好客户和良好资产负债表的公司,并补充说该公司的投资者仍然“谨慎”。
尽管Rathi表示公司没有计划为 Binance 创建行业基金的努力做出贡献,但 CrossTower 总裁 Kristin Boggiano 表示该公司及其几位支持者已考虑建立自己的救援风险基金。[2022/11/24 8:02:53]
但就在AI竞赛如火如荼开展之时,OpenAI的首席执行官SamAltman却表示巨型AI模型的时代已结束,“未来新一步的进化,将不会来自于巨型模型”。那同属该领域的Cohere又为何会获得资本的青睐呢?
CohereAI将其模型分为两类:生成模型和嵌入模型。生成模型通过对互联网上大量的数据进行训练,而嵌入模型是多语言支持的,可以支持超过109种语言。Cohere的模型有不同的规格,公司的指令模型每周都在进步,而同类领域的其他提供商通常要几个月或甚至一年才会发布重要的模型更新。
尽管CohereAI与谷歌合作获取其硬件能力,但其并不仅限于GoogleCloud。例如,Cohere在AWSSageMaker上运营,并计划在其他云服务提供商上提供服务。CohereAI的方法非常开放,并以客户为中心,他们通过在任何云供应商上运行以使客户获得最佳体验和服务。
迪拜DMCC与ComTech将合作提供基于区块链的黄金交易:11月22日消息,迪拜多种商品交易中心(DMCC)与ComTech Gold达成合作,将提供基于区块链的实物金条交易。
ComTech将在DMCC批准的金库中存放实物金条。DMCC是阿拉伯联合酋长国最大的自由贸易区。这些金条存款也将在Tradeflow上注册。Tradeflow是DMCC创建的在线平台,用于跟踪阿联酋金库中实物商品的来源。ComTech将在XDC区块链网络上发行由其实物黄金支持的代币CGO。(The Block)[2022/11/23 7:57:50]
相较于GPT-4,CohereAI尚未采用多模态方法。CohereAI的高级副总裁SaurabhBaji表示,“我认为图像和视频非常令人兴奋。但从商业角度来看,这也是一个不同的问题。我们并不关注AGI,而是专注于客户实际面临的问题。很多客户的需求都非常以语言为中心。”
从AI竞争格局的角度来看,CohereAI和OpenAI都是目前AI领域的重要参与者。虽然两家公司都专注于大型语言模型,但它们的重点和方法略有不同。OpenAI在一系列领域都有所涉猎,包括自然语言处理、计算机视觉和强化学习等。此外,OpenAI也吸引了大量的资本,其中包括像微软、谷歌和亚马逊这样的科技巨头。
相比之下,CohereAI专注于提供易于使用和部署的大型语言模型,为企业客户提供更好的商业解决方案。尽管CohereAI在规模和影响力上与OpenAI存在一定的差距,但其在语言模型方面的专注度和灵活性使其成为一个非常有前途的公司。
一MEV机器人花费31.06ETH交易费进行抢先交易:11月11日消息,PeckShield在推特上表示,一 MEV 机器人花费 31.06 枚以太坊的交易费用对一笔约 2500 万美元的交易发动「三明治攻击」,使得打包该区块的验证者总共获得了 32.09 枚以太坊(价值约 4.08 万美元)的奖励。[2022/11/11 12:51:52]
另外,在资本方面,CohereAI也获得了很多青睐。除了几个知名风险投资公司的支持,该公司还获得了加拿大政府和Google等科技巨头的支持。这些资金的注入有助于CohereAI继续扩展其业务和规模,并在AI市场上取得更大的份额。
总的来说,虽然CohereAI和OpenAI在AI竞争格局中处于不同的位置,但它们都是这个领域中非常有前途的公司。CohereAI在语言模型方面的专注度和灵活性使其成为一个与OpenAI进行竞争的关键因素之一,而资本的支持也给了CohereAI更多的机会来发挥其潜力,并在市场上取得更大的份额。
实用角度看大语言模型
大语言模型是一类基于深度学习技术的自然语言处理模型,它们具有大量的参数,并能够理解和生成人类语言。这类模型通常采用神经网络架构,尤其是Transformer架构。
近期,一篇综述论文《在实践中利用大模型的力量》在AI学术圈爆火,而其中一张名为“大预言模型进化树”的图片引起了不小的轰动,其梳理了2018年到2023年的大预言模型代表作。
相较于OpenAI不断深耕至今走向AI的前沿,曾经颇具影响力的谷歌BERT似乎从一开始就走向了“岔路”。当我们以年为单位看LLM发展史的时候,忍不住唏嘘“在大模型没有成功之前,一切都是场局”。
大语言模型发展进化史
2017年的时候,谷歌研究员在《Attentionisallyouneed》一文中介绍了Transformer架构——这也是目前最常用到的架构之一,是BERT、GPT等预训练模型的基础。时至今日,Transformer架构仍是GPT模型的基础架构。
Transformer架构的提出和预训练的方法将大语言模型推向了新的阶段——以谷歌为首的科技大公司在2017年后聚焦于研发能够处理多种自然语言任务的大模型。
2018年6月,OpenAI采用Transformer架构发布了它们的模型——GPT-1。紧接着,谷歌正式向世界介绍了全新预训练模型——BERT。
时间来到2019年,微软宣布与OpenAI达成10亿美金的合作。次年9月,OpenAI授权微软使用GPT-3模型,微软成为全球首个享用GPT-3能力的公司。
科技巨头Meta当然也不甘示弱,于2022年推出有着“开源版本的GPT-3”之称的OPT,并于今年推出能在单个GPU上运行的大语言模型LLaMA。
如今GPT-4也已发布,更强的文本生成能力与详细的逻辑判断能力让OpenAI在四年内快速崛起,并成功“破圈”。
Cohere的联合创始人NickFrosst对Altman认为大模型不会永远奏效的观点也是表示认同的,他表示“有很多方法可以让Transformer变得更好、更有用,而且很多方法并不涉及向模型添加参数”。Frosst还说,新的AI模型设计或架构,以及基于人类反馈的进一步优化,将会是许多人工智能研究人员已经在探索和有前途的方向。
一些有前景的LLM用例
利用LLM大模型可以做许多“很酷”的事情,但我们必须承认,基于人类实际需求的创新发展方向才是最根本的逻辑,所以“实用主义”是我们考量LLM应用的重要指标。
对于到底是选择只经过预训练的大模型LLM,还是在此基础上经过特定数据集微调后的较小模型问题,《在实践中利用大模型的力量》这篇论文给出的答案是具体情况具体分析,我们可以参照这张决策流程思维导图来获得一些启示。
各种基于LLM构建的应用程序在不断刷新我们的认知,计算机科学家ChipHuyen在其文章《为生产构建LLM应用程序》中为我们提供了一些有前景的LLM用例:
人工智能助手:针对不同用户群体来构建不同的任务,比如安排日程、做笔记、预订航班、购物等。但是,最终目标是打造一个可以帮助你做任何事情的智能助手。
聊天机器人:聊天机器人在API方面类似于人工智能助手。如果说人工智能助手的目标是完成用户交给它的任务,那么聊天机器人的目标更多的是成为一个伴侣。例如,你可以让聊天机器人像名人、电影角色、作家等一样说话。
学习:ChatGPT不仅可以生成问题,还可以评估学生输入的答案是否正确,以及对论文进行评分和反馈。同时,它也很擅长在同一个辩论话题上采取不同的立场,可以成为学生很好的辩论伙伴。
搜索引擎优化:如今,许多公司都依赖于创造大量内容,希望在谷歌上排名靠前。但在未来,搜索引擎优化可能会变得更像一场猫捉老鼠的游戏:搜索引擎会想出新的算法来检测人工智能生成的内容,而公司则会更好地绕过这些算法。人们可能也会减少对搜索的依赖,而更多地依赖品牌。
除此之外,大语言模型可以帮助生命科学研究人员更好地理解蛋白质、分子、DNA和RNA,帮助信用卡公司进行异常检测和欺诈分析以保护消费者,帮助法律团队进行法律释义和抄写等。
在未来的模型面前,或许现在我们看到的大模型只是蝼蚁。但我们可以期待,未来更加强大的语言模型将会更彻底改变人们的生活方式。
现在,我们可以看到越来越多的企业涌入AI的洪流,个体也不可避免地主动参与或者被席卷进去,我们永远不知道明天会发生什么。未来的另一个五年又会有多少大语言模型出现,谁又将冲在行业最前端呢?让我们拭目以待。
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。