11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
4月24日,苹果开源了大语言模型OpenELM。这与微软刚开源的Phi-3Mini类似,是一款专门针对手机等移动设备的模型。这次苹果真的是很有诚意的开源,一开到底所有内容都贡献出来了,家大业大就是敢玩。
开源大模型还是闭源大模型,究竟谁才是“版本答案”?围绕这个问题,360创始人周鸿祎和百度创始人李彦宏最近就来了一次隔空论战。先是在4月12日,有媒体曝光了李彦宏在百度内部的讲话。大模型到底是开源好、还是闭源更佳,目前在技术层面暂时还没有分出高下,但闭源或开源对于不同公司的商业利益却各有优劣。
在近日的一次内部讲话中,百度董事长李彦宏给开源大模型泼了不少冷水。李彦宏认为,大模型开源的意义不大,闭源模型在成本和能力上会持续领先。其实你仔细听听李彦宏说的是有道理的,他是说在写古诗方面,百度超过了GPT4,”周鸿祎的这番言论也引发了现场轰笑。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、李彦宏:百度搜索已有11%结果由AI生成在百度2024年第一季度财报电话会上,百度创始人李彦宏深入探讨了公司的业务表现和未来发展方向,强调人工智能技术对用户体验的推动�
谷歌推出了一款名为PaliGemma的开源视觉语言模型,该模型结合了图像处理和语言理解的能力,旨在支持多种视觉语言任务,如图像和短视频字幕生成、视觉问答、图像文本理解、物体检测、文件图表解读以及图像分割等。PaliGemma的关键特点:多任务支持:PaliGemma能够处理多种视觉语言相关的任务,提供广泛的应用场景。开源的特性意味着PaliGemma可以被社区广泛地使用、改进和集成到各种产品和服务中。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、谷歌急了,终极杀器对打GPT-4o视频模型Veo硬刚Sora谷歌近日发布了一系列强大的AI工具,包括ProjectAstra、Veo视频模型和Gemini1.5Pro,旨在彻底颠覆谷歌搜索并挑战OpenAI。这一举措在�
腾讯开源了混元DiT图像生成模型,对英语和中文都有着精细的理解能力。Hunyuan-DiT能够进行多轮多模态对话,根据对话上下文生成并细化图像。它通过结合Transformer结构、文本编码和位置编码,以及训练一个多模态大型语言型,实现了对中英文的细粒度理解,并在图像生成等任务中取得了显著的效果。
腾讯旗下引人注目的混元文生图大模型宣布全面开源,这一重要举措标志着人工智能领域的又一里程碑。该模型已在HuggingFace和Github平台上发布,包含完整的模型权重、推理代码和算法,面向全球的企业与个人开发者免费开放商用。我们期待这一技术的进一步发展和应用,为人工智能领域带来更多的惊喜和突破。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、干翻所有语音助手!制造复杂性增加,2024年内存供应将持续紧张。
零一万物近日发布了其模型家族的新成员——Yi-1.5,并宣布这些模型均采用Apache2.0许可开源。Yi-1.5是Yi模型的升级版,它在编码、数学、推理和指令遵循能力方面展现出更强的性能,同时保持了在语言理解、常识推理和阅读理解方面的卓越能力。模型性能:Yi-1.5在多个基准测试中展现了其强大的性能,特别是在处理复杂任务时。
RefuelAI最近宣布推出两个新版本的大型语言模型,RefuelLLM-2和RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务设计,旨在提高处理大规模数据集的效率。RefuelLLM-2的主要特点包括:自动化数据标注:能够自动识别和标记数据中的关键信息,如分类数据和解析特定属性。RefuelAI的这一创新为数据标注和清洗领域带来了新的解决方案,有助于自动化和优化大规模数据处理流程。
IBM最近发布了一组名为"GraniteCode"的开源型,旨在帮助企业完成各种软件开发任务,并在基准测试中表现出色。这些模型不仅过了一些较大的开源竞争对手在编程任务中展现出了强大的性能。些模型的特点包括灵活的规模选择、基于广泛训练数据的逻辑推理能力和良好的性能未来,IBM还计划不断改进和更新这些模型,以满足不同编程任务的需求。
随着ChatGPT、Midjourney等大模型产品的影响力、应用场景越来越多,为了确保输出的内容安全、可靠,对齐成为开发人员的关注重点和难点。但现在的模型参数少则几百亿多则上千亿,想通过传统的监督式微调方法来完成对齐效果往往不理想。在多轮AI对话中,可以指导模型生成符合用户期望的回答;在文本摘要任务中,可以指导模型生成更加准确和有信息量的摘要内容;在机器翻�
国内的开发者们或许没有想到,有朝一日,他们开发的AI大模型会像出海的网文、短剧一样,让世界各地的网友坐等更新。来自韩国的网友已经开始反思:为什么我们就没有这样的模型?这个「别人家的孩子」就是阿里云的通义千问。在我们看来,近一年来通义系列的持续开源,对中文大模型社区的发展非常有意义,也期待后续有越来越多的强劲大模型继续开源。
阿里云正式发布了通义千问2.5,模型性能全面赶超GPT-4Turbo,声称地表最强中文大模型。通义千问2.5最新开源的1100亿参数模型在多个基准测评中均取得了最佳成绩,成功超越了Meta的Llama-3-70B模型,成为开源领域的新标杆。这款模型在HuggingFace代码模型榜单BigCode上位居前列,同时还是国内用户规模第一的智能编码助手通义灵码的底座。
香港大学数据智能实验室主任黄超团队开发了一款名为OpenGraph的图基础大模型,专注于在多种图数据集上进行零样本预测。该模型通过学习通用的图结构模式,仅通过前向传播即可对全新数据进行预测,有效缓解了图学习领域的数据饥荒问题。研究人员希望借助OpenGraph显著增强模型在零样本图学习任务中的泛化能力,并探索多种下游应用。
红帽在最近举办的峰会上宣布推出了RedHatEnterpriseLinuxAI开发者预览版。该产品被定位为基础模型平台,用于无缝开发、测试和运行同类最佳的开源Granite生成式人工智能模型,为企业应用提供动力。该产品将对企业开发、测试和运行开源生成式AI模型提供有力支持,为企业应用提供了全新的动力和便利。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、干翻AIPC!苹果M4芯片首发新款iPadPro顶配超2万苹果公司在春季新品发布会上展示了最新技术和产品革新,包括配备M4芯片和双层OLED屏幕的新款iPadPro,以及ApplePencilPro和更大尺寸的iP
魔搭ModelScope社区宣布,DeepSeek-V2系列模型现已在魔搭ModelScope社区开源。幻方公司在5月6日推出了第二代MoE模型DeepSeek-V2,并开源了技术报告和模型权重,该模型引入了MLA架构和自研Sparse结构DeepSeekMoE,以236B总参数、21B激活,实际部署在8卡H800机器上,输入吞吐量超过每秒10万tokens输出超过每秒5万tokens。DeepSeek-V2的推理代码和模型下载链接已经在魔搭ModelScope社区开源,用户可以通�
开源大模型,已经开启大卷特卷模式。太平洋两岸,双雄格局正在呼之欲出。自研大模型的必要性和竞争力,正在不断被开源卷王们卷没了。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、清华团队发布视频大模型Vidu可生成16秒、1080P视频清华大学与生数科技在中关村论坛未来人工智能先锋论坛上发布了中国首个长时长、高一致性、高动态性视频大模型Vidu,标志�
元象公司发布了首个多模态大型模型XVERSE-V,并将其开源。这一模型支持任意宽高比的图像输入,并在多个权威评测中取得了优异的成绩。除了图像识别,XVERSE-V还在多个实际应用场景中表现突出,包括信息图理解、视障场景处理、文本生成、教育解题等。
阿里巴巴宣布开源其最新的Qwen1.5系列语言模型-Qwen1.5-110B。这是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超过1000亿参数的模型。它在与最近发布的SOTA模型Llama-3-70B的性能上表现出色,并且明显优于72B模型。
通义千问团队开源的首个千亿参数模型,Qwen1.5-110B。该模型在基础能力和Chat评估中表现出色,与其他同类模型相比有显著提升。团队将继续探索模型规模提升和扩展预训练数据规模两种方法带来的优势。
【新智元导读】最大开源模型,再次刷爆纪录!Snowflake的Arctic,以128位专家和4800亿参数,成为迄今最大的开源模型。是又大又稀疏,因此计算资源只用了不到Llama38B的一半,就达到了相同的性能指标。他本人的研究兴趣是机器学习与系统的交叉领域。
【新智元导读】前段时间,微软公布并开源了最新一代大模型WizardLM-2,号称性能堪比GPT-4。还未上线一天,模型权重和公告全被删除了,原因竟是......上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。开发者们还需要耐心等待,微软团队承诺,会在测试完成后重新上线。
4月23日晚,微软在官网开源了小参数的大语言模型——Phi-3-mini。Phi-3-mini是微软Phi家族的第4代,有预训练和指令微调多种模型,参数只有38亿训练数据却高达3.3Ttokens,比很多数百亿参数的模型训练数据都要多,这也是其性能超强的主要原因之一。Phi-3-medium的性能可媲美Mixtral8x7B和GPT-3.5,资源消耗却更少。
在最新的播客访谈中,小扎再次展现了他的「开源英雄」形象。如果花费100亿美元研发的模型对人类安全且有益,他将选择开源。他对于AI模型能力的未来提升持保留态度,认为短期内不太可能实现AGI,需要解决能源问题可能需要几十年的时间。
GPT-4又又又被超越了!近日,LLM竞技场更新了战报,人们震惊地发现:居然有一个开源模型干掉了GPT-4!这就是Cohere在一周多前才发布的CommandR。排行榜地址:https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard截至小编码字的这个时间,竞技场排行榜更新到了4月11号,CommandR拿到了2.3万的投票,综合得分超越了早期版本的GPT-4,和GPT-4-0314版本并列第7位,——它可是一个开源模型。2024年,在开源和闭源两条道路上,LLM都发展迅猛。
扎克伯格:「有了Llama3,全世界就能拥有最智能的AI。」ChatGPT拉开了大模型竞赛的序幕,Meta似乎要后来居上了。也许只有OpenAI的GPT-5才能压下开源模型了。