11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
360宣布AI员工[红衣]入职事业部,他是首位正式入职的数字安全专家,由360安全大模型支持。在安全运营工作中,他承担了安全分析搭子、安全处置专家、应急响应专家、安全知识咨询顾问、安全运营助手等多重角色,一人扛起360AI事业部的大旗。360呼吁安全运营团队可以依靠红衣这样的AI员工来提升工作效率和解决人才短缺问题。
QQ浏览器推出了一款名为“PDF阅读助手”的智能工具,用户可以申请加入体验测试。该工具由腾讯混元大模型支持,可以在手机或电脑上随时使用。该助手还将覆盖Word、Excel、PPT和网页等更多应用场景。
月之暗面宣布Kimi大模型学会了使用工具,即API已支持ToolCalling功能。通过这个功能,开发者可以让Kimi大模型与各种自定义外部工具进行交互,从拓展AI应用的想象空间。月之暗面表示,随着外部工具调用能力的提升,基于大模型的AIAgents应用将进入新阶段,为用户带来更多可能性,从聊天对话到完成各种任务,融入用户实际工作流程。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、BlockadeLabs发布全新模型Model3本文介绍了知名生成式AI平台BlockadeLabs发布的全新模型Model3,该模型实现了生成效果的质的提升,支持超高清8192x4096分辨率,提升了文本提示器描述生
阿里云百炼大模型服务平台近期宣布了一项重要的支持计划,即为Meta公司最新开源的Llama3系列大语言模型提供全方位的支持。这项服务包括限时免费的模型训练、部署和推理服务,旨在帮助企业和开发者在阿里云平台上构建和优化自己的专属大模型。通过结合阿里云强大的云计算资源和Llama3模型的先进性能,企业和开发者将能够开发出更加智能和高效的AI应用,加速AI技术的创
万兴科技公布其旗下音视频多媒体大模型——万兴“天幕”将于4月28日迎来公开测试阶段。公司副总裁朱伟指出,尽管大模型在文本和图像领域已经实现了生产力的商业化应用,但在音视频领域,由于数据集不足、视频内容结构复杂、算力成本高昂等问题,其成熟应用仍需时间。特别是在文生视频方面,该模型已能够实现不同风格、场景及主题的连贯性生成,且支持一键生成60
Spline的最新3D生成工具的发布,标志着3D设计领域的一次重大进步。这款在线3D编辑工具不仅支持从文字和图片生成3D模型能够混合和编辑3D模型,为用户提供了一个全面强大的3D设计解决方案。这意味着用户可以始终接触到行业的最新趋势,并将这些新功能应用到自己的项目中,保持创作的前沿性和创新性。
Ollama软件的最新更新为用户带来了一系列显著的性能提升和新功能。这次更新主要集中在优化软件性能,提高VRAM的利用率,减少内存不足的错误,并改善GPU的运行效率。无论是研究人员、开发者还是普通用户,都能够从Ollama的新功能和模型支持中受益。
在2024年百度CreateAI开发者大会的盛会上,百度集团执行副总裁、百度智能云事业群总裁沈抖发布了百度智能云万源全新一代智能计算操作系统。这款操作系统的内核设计独具匠心,不仅集成了百度文心大模型等一系列特色鲜明的大模型,更具备对其他第三方大模型产品的兼容能力,从全面满足了业界对大模型使用的多样化需求。这些工具不仅降低了开发门槛,更使得开发者们能够轻松应对多样化用户的需求,为AI应用的普及和发展注入了新的活力。
360公司自主研发的7B参数大模型——360智脑,现已正式上线开源社区,并提供了基础模型以及4K、32K、360K三种不同文本长度的版本。这一大模型在支持文本长度方面表现出色,最长可处理360K长文本,相当于约50万字的输入内容。在中英文360K大海捞针效果测试中,也取得了超过98%的高分。
今日,华为官方宣布将推出全新华为MateBookXPro笔记本,将在4月11日的华为鸿蒙生态春季沟通会上发布。华为常务董事、终端BGCEO余承东表示,这款产品不仅突破了轻薄与性能难以兼得的难题,更将首次支持华为盘古大模型,AI体验更进一步。快科技注:华为盘古系列基础大模型于2021发布,包括NLP、CV和科学计算大模型,后续发布了矿山、药物分子、气象、海浪等行业大模型。
著名开源大模型平台Stability.ai在官网正式发布了音频模型StableAudio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐,时长可达3分钟44.1kHz。随着Stability.ai不断推出新功能和技术,用户可以期待更多高质量、多样化的音乐生成体验。
百度智能云与迪思传媒合作开发的AI视频创作模型D&S-AlVideo正式上线,并集成至迪思AI智链。D&S-AIVideo凭借其强大的计算与数据分析能力,可以实现对海量视频素材的智能拆分与标签配置,并依托迪思AI智链的生文模型,实现视频的一键生成。迪思传媒已经将一念用于营销活动中,如只需告诉一念“帮我生成一个,大模马自达CX-50的视频宣传文案”型即可生成脚本、深度理解内容、进行画面抽取、匹配音乐、字幕、配音,5分钟内生成一支符合短视频平台的竖版创意视频。
日前,360创始人周鸿祎发文,称自己是开源的信徒”,信奉开源的力量。他还宣布即将开源360智脑7B,支持360k长文本输入。月之暗面宣布Kimi智能助手启动200万字内测,文心一言计划在下个月将字数上限提高至200万-500万字。
360创始人周鸿祎公开宣布了一个重要决定:即将开源360智脑7B模型,该模型具备70亿参数,并支持长达360k的文本输入。周鸿祎自称为“开源的信徒”,坚信开源的力量,并认为此举可以避免行业内的重复劳动,推动技术进步。阿里通义千问更是宣布免费开放1000万字长文档处理功能,进一步推动了长文本处理技术的发展。
AI21发布了世界首个Mamba的生产级模型:Jamba。这个模型采用了开创性的SSM-Transformer架构,具有52B参数,其中12B在生成时处于活动状态。这意味着Jamba模型在处理需要理解大量文本和复杂依赖关系的任务时,既能保持高效率,又不会牺牲性能或精度。
一款名为VoiceCraft的语音模型引起了业界的广泛关注。该模型的性能已经超过了XTTS,这无疑为AI音频处理领域带来了新的突破。虽然目前还没有详细的试用报告出炉,但从已经公开的演示效果来看,VoiceCraft的表现确实令人印象深刻,显示出了巨大的潜力。
MistralAI最新开源了Mistral7Bv0.2BaseModel,在一个名为CerebralValley的黑客松活动上宣布。这次更新将上下文提升到32K,取消了滑动窗口,同时设置了RopeTheta为1e6。MistralAI将继续努力,与同行竞争,并为客户提供更优质的人工智能解决方案。
按照惯例,苹果会在6月份的WWDC上发布iOS18、watchOS11、visionOS2等全新系统。其中iOS18比较受关注,被许多爆料者称为iOS史上最大升级。三星S24系列国行版的内置AI功能就是百度提供的技术支持,预计iOS也会是同样的模式。
高通最强手机芯片骁龙8Gen3迎来了一款与它同源的「旗舰级」产品。3月18日,高通正式推出了第三代骁龙8s移动平台,凭借旗舰级的CPU、GPU和AI性能,全方位支持了强大的终端侧生成式AI功能、始终感知的ISP、超沉浸的移动游戏体验、突破性连接能力和无损高清音频。至于骁龙8sGen3能否「兑现」所宣称的各方面能力提升,我们期待手机厂商尽快发布新品,来验一验这款全新骁龙旗舰芯片的成色。
高通技术公司震撼发布全新旗舰级移动平台——第三代骁龙®8s,为Android旗舰智能手机市场注入了全新活力。这款平台不仅继承了骁龙8系平台广受欢迎的特性,更在多个方面实现了显著升级,为用户带来前所未有的顶级移动体验。首款搭载该平台的终端预计将于3月正式面市,届时消费者将能够亲身体验到这款旗舰级移动平台带来的非凡魅力。
Cohere团队于2024年3月11日发布了Command-R,一款旨在实现生产规模人工智能的新型检索增强生成模型。该模型专注于检索增强生成和工具使用,是可扩展的生成模型,旨在帮助企业从概念验证迈向实际生产。期待用户对Command-R的反馈,并期待在未来提供更多可扩展的模型,助力企业成功迈向生产规模的人工智能应用。
由于硬件限制,其为移动设备开发的AI语言大模型GeminiNano暂时无法运行在新款Pixel8手机上,但未来有望在其他高端设备上推出。GeminiNano是谷歌旗下大模型Gemini的移动版本,能够在手机上本地运行,无需连接外部服务器。但是谷歌表示这一AI大模型未来将支持其他高端移动设备,为用户带来本地化的智能体验。
开发顶级的文生图模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了AIGC社区创新的一大阻碍。同时随着时间的推移,AIGC社区又能获得持续更新的、更高质量的数据集和更先进的算法。
Meta公司正全力投入生成式AI技术,计划在2026年之前推出一个能够支持视频内容的全新AI模型。根据Facebook总裁汤姆·艾利森在旧金山摩根士丹利科技大会上的广泛讨论,该公司的技术路线图将专注于开发一个能够推动视频领域的AI模型,包括Reels和更长的发布形式的内容。AI还可以向用户发送与其问题相关的先前帖子,用户还可以与AI进行互动。
一款名为ChatwithMLX的大模型框架推出,专为Mac用户打造,让他们也能享受本地大模型的乐趣。这个框架仅需两行代码即可部署,支持与本地数据交互,并提供中文支持。对于Mac用户来说,这无疑是一次令人振奋的消息,也让他们更便捷地体验到大模型带来的便利和乐趣。
零一万物发布了Yi大模型API,并启动了公测。这次邀测提供了两种模型:Yi-34B-Chat和Yi-34B-Chat-200K。Yi大模型API与OpenAIAPI完全兼容,可以平滑迁移,享受Yi大模型的超凡魅力。
由北京大学、南洋理工大学S-Lab和上海人工智能实验室联合研究的团队推出的大型多视角高斯模型引起广泛关注。LGM以其核心模块LargeMulti-ViewGaussianModel为基础,采用了一种新颖的方法,能够在仅5秒的时间内从单一视角图片或文本输入中生成高分辨率高质量的3D物体。LGM通过创新的3D表示和骨干结构,以及高效的训练方法,实现了在高分辨率3D内容生成方面的显著进展。
在深度学习技术的推动下,图像分割领域发生了巨大变革VisionTransformers在其中发挥了重要作用。本文介绍了一种基于Transformer的图像分割模型——Mask2Former,该模型在语义、实例和全景分割任务上都能够使用相同的架构,具有通用性。在实际应用中,需要根据具体需求权衡模型性能和资源消耗,选择合适的模型。
无论是开源的LLaMA2还是闭源的GPT系列模型,功能虽然很强大,但对语言的支持和扩展比较差,例如,二者都是以英语为主的大模型。为了提升大模型语言的多元化,慕尼黑大学、赫尔辛基大学等研究人员联合开源了,目前支持语言最多的大模型之一MaLA-500。相比原始LLaMA2模型,MaLA-500在主题分类等评测任务上的准确率提高了12.16%,这说明MaLA-500的多语言优于,现有的众多开源大语言模型。