首页 > 业界 > 关键词  > 通义千问最新资讯  > 正文

AI视野:阿里云开源Qwen-72B大模型;Meta推三项新AI项目;Sam Altman回应Q* 相关问题;天工SkyAgents发布

2023-12-01 15:17 · 稿源:站长之家

🤖📈💻💡大模型动态

阿里云开源Qwen-72B大模型

阿里云开源了通义千问Qwen-72B(720亿参数)、Qwen-1.8B(18亿参数)以及音频大模型Qwen-Audio,提供对话模型和量化版,支持开发者推理训练。

image.png

体验地址:https://modelscope.cn/studios/qwen/Qwen-72B-Chat-Demo/summary

【AiBase提要:】

🎉 Qwen-72B模型:720亿参数,拥有强大系统指令能力,支持通过提示词定制AI助手。

🗣️ Qwen-1.8B模型:18亿参数,可进行对话任务,提供对话模型和量化版,开发者可在魔搭社区体验下载。

🔊 Qwen-Audio模型: 针对音频,可将语音转换成文本,为大规模音频语言模型领域带来重大突破。

DeepMind发布自监督扩散模型SODA

Google DeepMind发布的自监督扩散模型SODA通过无监督方式精准控制扩散模型,实现风格与内容分离及3D视图生成。

【AiBase提要:】

🔄 模型介绍: DeepMind发布SODA,一种自监督扩散模型,利用图像编码器和去噪解码器实现无监督学习,捕获视觉语义。

🎨 强大生成能力: SODA展示在多个数据集上的强大表示和生成能力,包括线性探测分类、图像重建、新视角合成等实验。

🌐 潜在应用: 该模型不仅在图像生成方面表现出色,还能学习强大的语义表示,为动态组合场景等领域提供新思路。

📰🤖📢AI新鲜事

Meta AI实验室推三项新AI项目

Meta AI实验室庆祝成立十周年,推出Ego-Exo4D视频学习数据集、Seamless Communication语言交流AI模型、以及Audiobox音频生成模型,展示了在增强现实、跨语言交流和音频生成领域的创新成果。

image.png

【AiBase提要:】

🌐 Ego-Exo4D: Meta发布支持视频学习和多模态感知的数据集,覆盖复杂人类活动,如运动、音乐、烹饪,可用于增强现实、机器学习和社交网络。

💬 Seamless Communication: 推出四个AI研究模型,旨在实现更自然、真实的跨语言交流,包括语音表达和语境保留的SeamlessExpressive等功能。

🎶 Audiobox: Meta的新音频生成模型,通过语音输入和自然语言文本提示生成声音和音效,为研究人员提供先进的音频生成研究支持。

海纳AI完成数千万元A轮融资

近日,海纳AI成功获得数千万元A轮融资,由联想创投独家投资。这笔资金将用于人才招募、AI模型研发和营销体系搭建,以提升产品和服务品质,扩大竞争优势。海纳AI在2023年推出基于最新GPT技术的Hina AI2.0大模型,专注于打造AI面试测评平台,服务包括沃尔玛、顺丰、吉利等500强企业,面试人数超过700万。

【AiBase提要:】

🚀 融资成功: 海纳AI获得数千万元A轮融资,由联想创投独家投资。

💡 资金用途: 资金将用于人才招募、AI模型研发、营销体系搭建,提升产品品质和服务竞争优势。

🌐 AI面试服务: 基于最新GPT技术推出的Hina AI2.0大模型,服务包括500强企业,面试人数超过700万。

Sam Altman首次回应Q* 相关问题

经历董事会政变后,Sam Altman回归OpenAI首席执行官,就解雇原因拒绝透露,表示董事会将进行独立审查。

【AiBase提要:】

🔄 复职背后的心路历程: Sam Altman回应董事会请求,表示对公司的热爱和对团队的信任驱使他回归。

❓ 解雇原因成谜: Altman对于自己被解雇的原因保持沉默,董事会将进行独立审查,他欢迎这一决定。

🚀 未来展望: 公司治理结构调整将需要时间,Altman强调对安全工作的承诺,而最近关于Q*模型的突破则未受事件影响。

亚马逊否认计划使用AI完成《Road House》续集

亚马逊否认使用人工智能完成《Road House》续集,与制片人乔尔·席尔弗的指控相悖,强调电影已于2022年10月杀青,不存在在罢工期间使用AI的可能性。

【AiBase提要:】

📰 亚马逊否认计划使用AI制作《Road House》续集,反驳制片人席尔弗的指控。

🎬 制片人因反对在罢工期间使用AI而被开除,亚马逊称指控毫无真实性。

🚫 电影已于2022年10月杀青,亚马逊强调不存在在罢工期间使用AI的可能性。

COLE AI系统利用多模型联合生成高质量设计

一年过去了,微软亚洲研究院和北京大学的研究人员合作开发的COLE AI系统在图形设计领域取得了显著进展。该系统通过多个AI模型的协同作业,为用户提供可编辑的图形设计,不仅生成图像,还能嵌入相关文本,具备可编辑文本和视觉元素的功能。

image.png

论文网址:https://arxiv.org/pdf/2311.16974.pdf

【AiBase提要:】

🌐 COLE采用了Meta的Llama2-13B、DeepFloyd IF、LLaVA1.5-13B和GPT-4V等多个AI模型的组合,通过对互联网上的高质量原始图形设计图像进行训练,实现了出色的设计生成效果。

🖌️ COLE不仅能生成清晰有序的图形设计,还能在图像内生成可编辑的文本和对象区块,为用户提供直接编辑的便捷方式,避免了导出到其他设计软件的繁琐步骤。

🚀 COLE系统在生成各种设计项目时表现出色,研究人员认为它有可能让没有图形设计培训或专业知识的人能够生成与专业设计师媲美的高质量设计。

🤖📱💼AI应用

阿里国际站上线OKKI AI

OKKI AI是面向全行业企业的外贸SaaS工具,以客户管理和辅助决策为核心能力,能帮助外贸商家从琐碎事务中解放出来,提高效率和决策质量。

微信截图_20231201090434.png

【AiBase提要:】

😎 OKKI AI是外贸SaaS工具,主打客户管理和决策辅助,解放商家时间,提高工作效率。

🚀 一键生成开发信、智能客户管理和业务分析是OKKI AI的亮点,受到外贸业务员好评。

📈 对于管理者,OKKI AI提供全盘业务了解,包括订单跟进、客户分布、团队成员报告等,助力决策。

快速绘制,实时推理,tldraw+LCM太好玩啦!

近期,清华发布的潜在一致性模型LCM与fal.ai的API推出的实时绘图工具drawfast结合,通过创新性方法实现了仅需少数几步推理即可高效生成高分辨率图像。drawfast是一款开源协作式数字白板,结合GPT4-Version,用户能在画布上绘制草稿实时生成UI,并复制相关html/css代码,为用户提供了便捷的绘图工具。

image.png

体验地址:https://top.aibase.com/tool/drawfast

【AiBase提要:】

🚀 LCM与drawfast结合,提供用户快速绘制、实时推理的绘图体验。

🖌️ drawfast是一款开源协作式数字白板,搭配GPT4-Version,实时生成UI并提供代码。

💡 用户可在drawfast上产生高效、美观的作品,释放创意潜力,展示工具的创意性和可玩性。

在线图像编辑器miniPaint:开源Photoshop网页最强替代品

miniPaint是一款基于HTML5技术的在线图像编辑器,无需下载安装,直接在浏览器中运行,支持丰富的编辑功能,是Photoshop的强大替代品。

image.png

项目地址:https://github.com/viliusle/miniPaint

【AiBase提要:】

🎨 miniPaint利用HTML5技术,无需下载安装,成为浏览器中的最强在线图像编辑器。

🌐 支持多种图像编辑功能,包括图层、滤镜,操作直接在浏览器中完成,保障用户隐私安全。

🛠️ 项目开源,采用MIT许可证,提供丰富特效和工具,鼓励用户贡献和反馈。

Wombo推AI头像应用程序Wombo Me

Wombo公司推出的新应用Wombo Me,通过一张自拍照片即可迅速生成多个逼真的头像,强调趣味性,支持化身名人、电影角色等,未来计划加入更多互动元素。

【AiBase提要:】

🚀 创新应用发布: Wombo Me由Wombo公司推出,通过一张自拍照片即可快速生成多个逼真头像,相较其他应用更高效。

😄 注重趣味体验: 应用强调趣味性,用户可尝试不同角色,如名人、电影角色,分享到社交媒体展示专业和个性形象。

🌐 未来发展计划: 公司计划引入更多互动元素,如语音和视频,以推动AI在社交媒体内容创造领域更深入的发展。

👨‍💻💡🎯聚焦开发者

昆仑万维发布天工SkyAgents

昆仑万维推出「天工 SkyAgents」AI Agent 开发平台,基于「天工大模型」,支持零代码构建个性化 AI 智能体。适用于个人和企业,实现一键服务部署。

AiBase提要:

🚀 用户可零代码打造私人智能体,基于大模型实现自主学习和模块化任务。

🏢 企业可用于构建个性化应用,包括 IT、智能客服、企业培训、HR、法律顾问等,并支持一键服务部署。

🔄 模块化语言模型和图形界面支持完全无代码操作,用户可以通过自然语言和简单操作进行任务设定和部署。

使用PyTorch加速生成式AI模型

介绍PyTorch团队如何通过本机PyTorch优化加速生成式AI模型,包括Torch.compile编译器、GPU量化、推测性解码和张量并行等技术。

【AiBase提要:】

💻 编译优化: 使用Torch.compile和静态KV缓存减少CPU开销,通过模型编译器提高性能。

🚀 内存带宽优化: 通过INT8仅权重量化缓解内存带宽瓶颈,提高模型推理速度。

🤖 推测性解码: 利用推测解码打破生成过程的串行依赖性,加速权重加载,提高生成速度。

基于大学水平考试的多模态AI测试基准MMMUs发布

最新发布的MMMUs基准挑战GPT-4V等模型,包含六个学科的30个科目,共有1.15万个多模态问题,考察机器在广泛多样任务上的专家级多模态理解和推理能力。

image.png

论文地址:https://arxiv.org/abs/2311.16502

项目网站:https://mmmu-benchmark.github.io/

【AiBase提要:】

🌐 MMMUs基准挑战GPT-4V,包含六个学科30个科目,1.15万多模态问题。

📚 问题设计注重深度,考察感知、知识和推理等基本技能。

🚀 MMMUs作为全面多模态AI测试基准,为评估专家级AGI提供新视角。

举报

  • 相关推荐
  • 千问,阿里的未竟之梦

    在一个大阿里和一个吴妈的统一指挥下,千问诞生了。 11月17日,阿里正式宣布推出“千问”项目,面向公众上线其App公测版。该项目前身为智能信息事业群旗下的“通义App”,改名后的千问号称“阿里最强大模型官方助手”,定位为“会聊天、能办事”的个人AI助手。 官方称,千问后期计划与阿里生态内的各类生活场景深度结合。其目标是与ChatGPT展开全面竞争,标志着阿里

  • 千问登场,阿里瞄准C端关键一战

    2023年9月,在正式接任CEO的第三天,吴泳铭发布的首份阿里全员信,宣布了阿里新的战略重点方向:用户为先、AI驱动。当时行业内更多把它视为一家企业在AI时代的惯性表述。 然而,就在过去一年中,围绕AI在C端用户场景的“可能性”,全球AI行业的叙事逻辑已经发生了明显转向。 OpenAI在完成大模型能力的“基座化”后,开始把更多资源押在C端生态。过去两年,随着GPT-5等产�

  • 阿里通义App重大品牌升级!正式更名为“千问”

    11月14日,阿里巴巴旗下“通义”App正式更名为“千问”,版本号从3.60.0跃升至5.0.0,已登陆苹果及各大安卓应用商店。该应用基于阿里最强Qwen大模型打造,具备对话问答、智能写作、多模态相机等核心功能,被定位为“阿里最强大模型官方AI助手”。阿里巴巴视其为“AI时代的未来之战”,已抽调上百名工程师加速推进,并同步研发国际版,计划借助Qwen模型的海外影响力与ChatGPT直接争夺全球用户。

  • 阿里巴巴回应千问崩了:状态良好 欢迎来问

    11月17日,阿里巴巴AI应用“千问”公测首日因用户涌入量过大,导致服务拥堵和中断,引发“千问崩了”话题登上热搜。官方迅速以轻松幽默语气回应“我好着呢”,并透露应用尚处初级版本,但已展现快速生成报告和PPT等“办事”能力。未来计划接入地图、外卖、办公等生活场景,拓展服务范围,提升用户体验。

  • 千问APP悄悄上线,阿里的AI超级入口也终于来了。

    阿里“千问”APP昨日在应用商店悄然上线,界面从通义APP的双色渐变变为简洁单色设计,功能大幅增强,支持Qwen全系列最新模型。此次品牌整合将阿里分散的AI触点统一为“千问”品牌,实现模型与产品名称对齐,让普通用户首次能在官方APP使用最强Qwen3-Max模型。APP默认开启联网搜索,集成图像编辑、视频通话等场景功能,通过智能意图识别实现一站式服务。这标志着阿里开始认真打技术+品牌两张牌,推动AI技术以更清晰方式触达用户。

  • Qwen用开源逆袭GPT的故事,千问APP要再干一遍

    Qwen模型逆袭GPT的策略,阿里准备再用一次。 2018年,OpenAI发布了自己的第一个模型GPT1,占据了技术先机,随后变得越来越封闭。在大洋彼岸,阿里几乎同一时间着手大模型研究,到2023年推出“通义千问”时,则选择了一条完全不同的路径:直接开源模型,允许开发者免费使用、改进和集成。 这个策略让Qwen逐步积累起规模,做到了如今全球开发者基于它发布了17万个衍生模型�

  • 阿里千问APP宣布开启公测 号称打造最佳个人AI助手

    阿里巴巴11月17日启动“千问”项目,全面进军AI to C市场,标志着其在人工智能领域的新战略布局。APP公测版已上线各大应用商店,网页和PC版同步推出,国际版即将上线。基于Qwen模型在海外的影响力,“千问”将与ChatGPT等国际产品竞争,展现中国AI实力。Qwen系列模型全球下载量突破6亿次,性能超越Llama等,成为全球最强开源大模型。“千问”致力于打造“会聊天能办事”的个人AI助手,已具备生成报告、制作PPT等能力,未来计划接入地图、外卖、办公等生活场景,成为用户得力助手。

  • 千问App上线实时翻译功能:覆盖全球超98%人口常用语种

    阿里千问App推出实时翻译功能,支持119种语言,覆盖全球98%以上人口的常用语言,成为国内首个具备此能力的AI助手。功能涵盖文字、图片、同声传译及面对面互译四大场景,其中同声传译不限时长与次数,完全免费。基于Qwen-MT模型,在多项翻译测试中表现优于GPT-4.1-mini等同类模型,与顶级大模型相当。目前已在部分中亚地区酒店初步应用,助力国际化落地。

  • GEO排名查询工具怎么用?手把手教你监测品牌在通义千问、Kimi等AI平台的推荐情况

    AI时代催生GEO(生成引擎优化)新范式,正逐步取代传统SEO。GEO关注品牌在AI问答中的提及率、推荐频次与排名,通过优化内容结构提升AI引擎推荐权重。AIBase平台推出专业GEO监测工具,支持五大主流AI平台实时检测,提供竞品对比与优化建议,帮助企业量化品牌在AI生态中的可见度,已成为数字资产评估新标准。

  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

今日大家都在搜的词: