11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
OpenBuddy团队发布了基于MetaLlama370B的最新成果:OpenBuddy-Llama3-70B-v21.1-8k,这是他们首次在Llama370B基座上的中文跨语言训练尝试。Llama370B是一个15T训练集训练成的稠密大模型,然由于训练集中缺少中文数据,Meta官方的Llama3系列对话模型在中文领域的认知、理能力较弱,容易出现以英文回答中文问题的现象。值得一提的是,于量化版模型能力下降较为明显,他们本次只发布了模型的完整版权重,后续会尝优化70B模型的量化后性能,并挑选合适时机发布量化版。
新型社交平台Soul近日宣布上线自研语言大模型SoulX。该模型基于海量数据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力,能够在保证对话流畅、自然、具备情感温度的同时,覆盖百种细粒度风险类别,保证了大模型的内容生产质量和安全性。SoulX的强大能力,将为Soul在社交关系和内容链路的打造上带来新的可能。
北京大学和中山大学等机构的研究者提出了一种名为Chat-UniVi的视觉语言大模型,实现了统一的视觉表征,使其能够同时处理图片和视频任务。这一框架的独特之处在于,它不仅在深度学习任务中表现卓越仅需短短三天的训练时间,就能够训练出具有130亿参数的通用视觉语言大模型。Chat-UniVi的提出为视觉语言模型的研究领域带来了新的思路,通过统一的视觉表征实现了对多模态数据的高效处理,为深度学习模型的训练和推理提供了更加便捷和经济的解决方案。
最近,来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA,使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能,并在图片、视频的13个基准上达到先进的性能。这些结果证明了联合图片和视频一起训练能够促进LLM理解视觉表示。
元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B,可免费商用。XVERSE-13B是由深圳元象科技自主研发的支持多语言的大语言模型,基于它生成的服务包括了文本生成、自动化写作、数据分析、知识问答等方面。训练框架:经过对算子、通信、并行策略及调度等的优化,千卡集群上的峰值算力利用率达到58.5%,达到业界前列。
2023年7月18日至20日,第二届自然语言生成与智能写作大会在新疆乌鲁木齐召开。中译语通科技股份有限公司作为大会战略合作伙伴,向与会嘉宾展示了公司格物大模型技术和工业实践。中国中文信息学会自然语言生成与智能写作专委会为中译语通等8家企业颁发感谢奖牌,表达各企业对本届大会的特别支持。
7月12日,【东风生万物】思必驰DFM-2大模型及创新技术应用成果发布会在苏州成功举行。思必驰董事长、CEO高始兴,联合创始人、首席科学家俞凯,分别分享了思必驰的未来战略以及以DFM-2大模型为代表的对话式AI创新技术。思必驰将发挥平台技术和语言大模型的优势,在政策指导下,建好“语言计算国家新一代人工智能开放创新平台”,提升创新技术发展与科研成果转化,助力产业整体竞争力提升,努力成长为壮大创新集群的支撑力量。
商汤科技今日举行技术交流日活动。商汤科技展示了「日日新+SenseNova」大模型体系。这些应用可以帮助开发者编写和调试代码、为用户提供个性化的医疗建议、并从复杂的文档中提取和概括信息。
2月22日晚,百度发布了其2022年年度业绩报告,财报显示,2022年,百度实现营收1236.75亿元,归属百度的净利润206.8亿元,同比增长10%。百度实现营收330.77亿元,归属百度的净利润53.71亿元,同比增长32%。以百度为首国内厂商,也一定能在这次AIGC的发展大潮中,推出有着中国特色的语言大模型,并跟随AIGC的进步方向,为各行各业的发展赋予新的能量,推动我国AI产业发展进入下一个时代。
在疫情爆发最初的12个月里,有超过100,000篇关于新冠病毒论文发表这产生了大量新信息。想要阅读和理解每一项研究是不可能的从理论上来说,Galactica可以做到。人工智能背后的团队没有回应澄清导致暂停的原因的请求。
小米官方宣布,小米大语言模型MiLM正式通过大模型备案。通过备案后,小米大模型将逐步应用于小米公司的汽车、手机、智能家居等产品中,通过端云结合,既带来单个设备的智能提升,也实现场景内和场景间多设备的协同,为人车家全生态战略赋能。在全新高通骁龙8Gen3终端上,基于NPU运行了小米自研60亿参数语言大模型,在首词响应、生成速度等几项关键指标上均处于行业领先水平。
研究人员介绍了LLEMMA,这是一个开源的大型语言模型,专门设计用于解决数学问题。与其他领先的数学语言模型相比,LLEMMA在性能上表现出色,为进一步的研究提供了一个强大的平台。”我们将会看到LLEMMA能够激发出哪些新的研究。
百度正在加速训练文心大模型4.0,并计划在10月17日的百度世界大会上发布。这一新版本将是文心大模型3.5的重要升级,重点提升基础模型能力,尤其在逻辑推理、代码和数学等方面取得显著进展。GoogleDeepMind提出DRaFT算法以高效优化扩散模型GoogleDeepMind最新提出的DRaFT算法用于高效优化扩散模型,提高了文本到图像生成等实际应用的效率和性能,成为机器学习领域的有价值工具�
【新智元导读】谷歌DeepMind提出了一个全新的优化框架OPRO,仅通过自然语言描述就可指导大语言模型逐步改进解决方案,实现各类优化任务。「深呼吸,一步一步地解决这个问题。这项研究首次提出并验证了使用大语言模型进行优化的有效性,为利用LLM进行更广泛优化任务提供了框架和经验,是这个新的研究方向的开拓性工作,具有重要意义。
国产大模型,登顶多模态榜单!昆仑万维最近在大模型圈可谓“风生水起”。几天前刚被曝挖来了AI大牛颜水成,出任天工智能联席CEO。在一次又一次的榜单排名更迭之中,属于多模态大模型的“ChatGPT时刻”终将会到来。
作业帮最近在2023中国国际服务贸易交易会上正式发布了自研银河大模型。银河大模型支持AI解题、多语言AI问答等能力,号称精通诗词字句和课文常识;并支持AI写作功能,可用于提高写作技巧、优化写作结构,并提供文章润色、语法纠错和创意启发等场景。作业帮表示,银河大模型即将在作业帮App等学习工具、旗下智能硬件及智能图书、教育数字化等多种场景中得到应用。
说到科技圈的近期新闻,没有比小马和小扎约架这件事更热闹的八卦话题了。马斯克直播了自己上门寻找扎克伯格的过程。想要了解数据集的更多细节,请参考OpenDriveLab发布在Github上的DriveLM演示数据。
近期研究人员提出了一种名为LEVER的技术,通过学习验证生成的程序与执行结果来改善自然语言到代码的生成。LEVER使用自然语言描述、程序表面形式和执行结果的组合表示进行训练,以识别和拒绝错误的程序。LEVER的技术可以提高代码LLMs将自然语言描述转化为可执行代码的能力,有潜力改善数据库接口、机器人控制和虚拟助手等人工智能应用。
亚马逊“最具野心”的大语言模型,将会是什么样?1.亚马逊被曝组建新团队研发大语言模型据外媒Insider近日报道,亚马逊CEOAndyJassy目前正直接领导一支新团队,负责开发该公司最具野心的AI项目。Jassy告知亚马逊的S-team,他将提拔Alexa首席科学家兼高级副总裁RohitPrasad作为自己的直接下属,向他直接汇报。大型语言模型和生成式人工智能对客户、股东和亚马逊来说都将是一件大�
谷歌年度开发者大会Google+I/O+2023上,PaLM+2大模型正式发布,准备向OpenAI的GPT-4等竞争对手发起挑战。PaLM+2是谷歌首个从头开始构建的多模态模型,具有不同规模的高度能力,并能有效地与其他工具和API集成。PaLM+2已经应用在25种功能和产品中,包括办公全家桶、聊天机器人Bard、搜索等等。
在商汤技术交流日活动上,商汤科技董事长兼首席执行官徐立宣布推出大模型体系商汤日日新大模型”。日日新”取自《礼记大学》,汤之盘铭:苟日新,日日新,又日新。基于大装置,商汤已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。
阿里M6大模型的前带头人杨红霞已加入字节AI+Lab,参与语言生成大模型的研发。杨红霞在语言生成大模型团队中处于领导地位,直接向字节跳动副总裁杨震原汇报。字节跳动相关技术负责人表示,技术中台在这些领域的探索仍处于初期,尚未成熟。
去年11月,谷歌宣布推出「1000种语言计划」,旨在构建一个机器学习++模型,支持世界上使用最广泛的1000种语言,从为全球数十亿人带来更大的包容性。其中一些语言的使用人数不到两千万,因此核心挑战是如何支持使用人数相对较少或可用数据有限的语言。USM+的基础模型架构和训练+pipeline+奠定了将语音建模扩展到未来1000种语言的根基。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、李彦宏:百度搜索已有11%结果由AI生成在百度2024年第一季度财报电话会上,百度创始人李彦宏深入探讨了公司的业务表现和未来发展方向,强调人工智能技术对用户体验的推动�
谷歌推出了一款名为PaliGemma的开源视觉语言模型,该模型结合了图像处理和语言理解的能力,旨在支持多种视觉语言任务,如图像和短视频字幕生成、视觉问答、图像文本理解、物体检测、文件图表解读以及图像分割等。PaliGemma的关键特点:多任务支持:PaliGemma能够处理多种视觉语言相关的任务,提供广泛的应用场景。开源的特性意味着PaliGemma可以被社区广泛地使用、改进和集成到各种产品和服务中。
RefuelAI最近宣布推出两个新版本的大型语言模型,RefuelLLM-2和RefuelLLM-2-small,这两个模型专为数据标注、清洗和丰富任务设计,旨在提高处理大规模数据集的效率。RefuelLLM-2的主要特点包括:自动化数据标注:能够自动识别和标记数据中的关键信息,如分类数据和解析特定属性。RefuelAI的这一创新为数据标注和清洗领域带来了新的解决方案,有助于自动化和优化大规模数据处理流程。
Meditron是一个基于Llama的大型医学语言模型,由Meta公司更新并发布。Meditron项目是完全开源的,包括数据、模型权重和配置,这意味着全球的研究人员和开发者都可以自由地访问、使用、修改和改进这一技术。在紧急情况下快速提供医疗响应,或在基础设施不足的地区辅助医疗工作,Meditron可以发挥重要作用。
Meta公司最新发布了LayerSkip,这是一款端到端的解决方案,专门设计用于提升大型语言模型的推理速度。这一技术在不同规模的Llama模型上经过了广泛的训练实验,并在多个任务上展现了显著的性能提升。未来展望:随着LayerSkip技术的不断完善和应用,预计将为大语言模型的部署和使用带来更多可能性,特别是在需要快速处理大量语言数据的场合。
Meta最近发布了LLama3,这是一款新的大型语言模型,用于实现更安全、更准确的生成式人工智能体验。除了LLM,Meta还推出了LlamaGuard2、CodeShield和CyberSecEval2等信任和安全工具,以帮助确保符合行业和用户安全期望。随着400亿参数显示出更高的准确性,可以推断出更高的AI硬件需求不会很快减少。
苹果公司正在开发自己的大型语言模型。这款模型将能够在设备上本地运行,从优先考虑速度和隐私保护。苹果更广泛的人工智能战略预计将在6月份的WWDC上与主要软件更新预览一起公布。