11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
对模型参数量的迷信、执念也许可以放下了,混合多个小模型也是未来构造对话型AI的一个光明的方向。在对话型人工智能研究中,存在趋势即朝着开发参数更多的模型方向发展,如ChatGPT等为代表的模型。混合模型通过协作多个较小的对话型人工智能,在提供比单个更大的对话型人工智能更高质量的对话方面是有效的。
谷歌最新发布的GeminiPro自发布以来备受瞩目,谷歌声称其优于GPT-3.5。CMU的研究通过深入的实验对比,展示了GPT-3.5在多个任务上的全面优势。这一研究为科技领域的大模型竞争提供了客观中立的第三方对比,为未来的模型发展提供了有益的参考。
日本的人工智能初创公司ELYZA宣布发布了一款基于Meta的「Llama2」的日本语言模型,该模型被命名为「ELYZA-japanese-Llama-2-7b」,拥有70亿参数。此举使得该模型能够与开放AI领域的巨头GPT3.5相媲美。虽然目前在参数数量上仍不及一些国际级模型,但这一进展为日本语自然语言处理和生成领域带来了更多可能性,未来可望进一步提高日本语LLM的性能。
中国工业互联网研究院针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。百度文心一言表现超过GPT3.5,综合评价指数在国内排名第一。其中百度文心一言表现超过GPT3.5,在国内大模型中排名第一。
映宇宙集团已经接入GPT3.5turbo,GPT4正在接入审核中。映宇宙方面表示,未来映宇宙在AIGC领域的探索主要有五大方向:数字人直播、互动社交、AI音乐、AI剧本和AI运营。旗下有映客直播、对缘、超级喜欢、积目等多款产品,覆盖直播、相亲、社交三大业务板块。
作为Meta对开放科学承诺的一部分,Meta公司日前公开了一个先进的大型语言模型,叫做LLaMA。这个模型可以让研究人员在人工智能领域做更多的探索。我们期待看到社区能从LLaMA中学到什么–并最终创造什么。
【新智元导读】6月,IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文,数据集就是程序员们最爱的LeetCode题库。研究揭示了LLM在代码任务中出现的潜在问题和能力局限,让我们能够对模型做出进一步改进,并逐渐了解使用ChatGPT写代码的最佳姿势。在多轮修复过程中,无论温度设置为0.7还是0,ChatGPT固定的代码片段在功能正确性、复杂性和安全性方面都可能存在差异。
SultanAli是一个内容编辑,他利用AI工具创作内容已经赚取了超过3500美元。下文SultanAli将分享自己如何利用AI工具创作内容赚钱的方法。我认为对我的服务的需求至少还会持续六七年。
开源类ChatGPT平台MistralAI获得4.5亿欧元融资,估值近20亿美元。本次由英伟达、Salesforce等投资。这不仅减少了计算需求可以限制模型的上下文范围,有助于模型关注局部信息。
10月27日,全球顶级机器人开发商波士顿动力在官网展示了一项新的研究,通过将ChatGPT、Spot以及其他AI模型相结合,开发了一种会说话的导游机器狗。该机器狗能够根据文字、语音提示与人类进行交谈,同时提供了视觉问答功能,可以分析摄像头拍摄的画面,自动生成图像说明。波士顿动力以开发高度先进、灵活且具有实用性的机器人闻名,其产品在工业、研究和消费领域都有
35年来,认知科学、人工智能、语言学和哲学领域的研究人员一直在争论神经网络是否能实现类似人类的系统泛化。人们一直认为,AI无法像人类一样具有「系统泛化」能力,不能对没有经过训练的知识做到「举一反三」,几十年来这一直被认为是AI的最大局限之一。我们正一步步接近未来:机器不仅能理解人类的的语言能掌握细微的差别和语义,从促进更加无缝和直观的人机交互未来。
自去年11月+ChatGPT+面向公众测试以来,OpenAI+一直占据各大科技网站的头版头条,以及成为很多开发者工具的首选。ChatGPT+的落地不仅仅可以提供代码建议、总结长文本、回答问题等等,更为重要的是它开启了+AIGC+的新时代。我想很多人都会喜欢它。
网络安全公司Darktrace+的研究人员发现,在2023年的前两个月,攻击者使用ChatGPT等生成式+AI,通过增加文本描述、句子长度以及标点符号,让社会工程攻击量增加了135%。Darktrace+还发现,带有附件或链接的恶意电子邮件数量有所减少。87%+的员工表示,他们担心自己的在线个人信息量可能会被用于网络钓鱼或电子邮件诈骗。
作为当前最火的AI应用,ChatGPT最近在各种刷屏,上线不到2个月就积累了过亿用户,增长速度比TikTok还要快,大家都在考虑ChatGPT到底能取代多少职业,现在新的受害者”出现了,电脑城的装机商以后没活络了,因为ChatGPT可以写DIY装机单了。有网友要求ChatGPT用500美元的预算,也就是3500元左右的价格装一台游戏PC,ChatGPT表示这个价位下装游戏PC很有挑战性,但还是可能的,它给出了一个配置单。但问题不是ChatGPT不行是现在的版本中ChatGPT投喂的数据是截止到2021年,因此它缺少最新产品的信息,否则配置单还可以优化一下。
LIama3.1正式发布,登上大模型王座!在150多个基准测试集中,405B版本的表现追平甚至超越了现有SOTA模型GPT-4o和Claude3.5Sonnet。最强开源模型即最强模型。我希望你能加入我们的旅程,将人工智能的好处带给世界上的每个人。
【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。这些差异可能是由于训练任务的变化造成的。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、震惊AI界!14、微软研究院推AI框架E5-V:用文本对的单模态训练简化多模态学习降低成本微软研究院与北京航空航天大学联合推出的E5-V框架通过单模态训练简化多模态学习,降低成本,在多个任务中展现出优异性能,代表了多模态学习的重大进步。
Llama3.1终于现身了,不过出处却不是Meta官方。Reddit上新版Llama大模型泄露的消息遭到了疯传,除了基础模型包括8B、70B和最大参数的405B的基准测试结果。在部署Llama3.1模型的任何应用之前,开发人员应针对模型的具体应用进行安全测试和微调。
7月23日凌晨,有人爆料,Meta的Llama3.1-405B评测数据遭遇泄漏,明天可能会发布Llama3系列中最大的参数模型,同时还会发布一个Llama3.1-70B版本。这也是在3.0版本基础之上进行了功能迭代,即便是70B的基础模型的性能也超过了GPT-4o。期待一波明天,看看Meta还能整啥花活。
【新智元导读】GPT-4omini深夜忽然上线,OpenAI终于开卷小模型!每百万输入token已达15美分的超低价,跟GPT-3相比,两年内模型成本已降低99%。SamAltman惊呼:通往智能的成本,已变得如此低廉!另外,清华同济校友为关键负责人。直到23年9月,他正式加入了OpenAI。
OpenAI突发新模型,全面取代老去的GPT-3.5。GPT-4omini,能力接近原版GPT-4,价格却要便宜一个数量级:每百万输入tokens,15美分每百万输出tokens,60美分在ChatGPT应用中,GPT-3.5已经完全退役,免费用户已可使用GPT-4omini模型。另一边则是推出了12B的小模型,同英伟达合作开发,上下文长度为128K。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、争气!该工具利用Python和Selenium技术,集成先进AI技术,支持多种验证码类型,引发了对验证码系统有效性和网络安全的讨论。
微软Azure首席技术官MarkRussinovich在官网分享了新型大模型入侵技术——“SkeletonKey”。万能钥匙是一种越狱攻击方法,其核心原理是使用多轮强制、诱导策略使大模型的安全护栏完全失效,让其回答一些禁止的答案,包括血腥、暴力、歧视、色情等非法内容。「AIGC开放社区」也用这种诱导式攻击方法测试了一下国内众多领先的大模型,不少产品也中招了能输出非法内容,希望可以引起安全方面的注意。
【新智元导读】来自佐治亚理工学院和英伟达的两名华人学者带队提出了名为RankRAG的微调框架,简化了原本需要多个模型的复杂的RAG流水线,用微调的方法交给同一个LLM完成,结果同时实现了模型在RAG任务上的性能提升。在需要大量事实知识的文本生成任务中,RAG成为了常用的LLM部署技巧。值得一提的是,本篇论文对标的基准方法ChatQA也是WeiPing之前的研究。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、百度文心智能体平台免费开放文心4.0版本百度文心智能体平台最新推出的文心大模型4.0版本免费开放给公众使用,极大地扩展了平台的功能和应用范围。这一投资有望降低电影�
【新智元导读】LLM能否解决「狼-山羊-卷心菜」经典过河难题?最近,菲尔兹奖得主TimothyGowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上,如今所有的LLM都失败了!几天前,菲尔兹奖得主、剑桥大学研究主任TimothyGowers直接拿GPT-4o开刀,去解决动物过河难题。LLM的未来究竟走向何处?最大的未知变量也许就在于,我们是否还能发现类似思维链这种解锁模型性能的「大杀器」了。
一项新的“大模型Benchmark”在推特上爆火,LeCun也点赞转发了!且无论是GPT-4还是Claude3,面对它都如同被夺了魂,无法给出正确答案。难倒一众大模型的,是逻辑学当中经典的“动物过河”问题,有网友发现,大模型对此类问题表现得很不擅长。前面网友针对训练数据和输出关系的分析,可能不无道理。
【新智元导读】刚刚,英伟达全新发布的开源模型Nemotron-4340B,有可能彻底改变训练LLM的方式!或许各行各业都不再需要昂贵的真实世界数据集了。值得注意的是,这一优势主要来自较低的长/冗长响应率。
高质量图像编辑的方法有很多,但都很难准确表达出真实的物理世界。EdittheWorld试试。最终可以看到,团队的方法可以很好地实现world-instructedimageediting。
虽然OpenAI最近推出的模型GPT-4o在大型语言模型领域有了重大突破,但该公司已经开始着手研发下一个旗舰模型GPT-5。许多人在GPT-4o发布前期就期待着OpenAI推出备受瞩目的GPT-5。我们将不再依赖AI助手告诉我们天气如何,它们将能够从开始到结束地帮助我们完成任务,这是我们期待的事情。