首页 > 业界 > 关键词  > 通义千问最新资讯  > 正文

AI视野:阿里云开源Qwen-72B大模型;Meta推三项新AI项目;Sam Altman回应Q* 相关问题;天工SkyAgents发布

2023-12-01 15:17 · 稿源:站长之家

🤖📈💻💡大模型动态

阿里云开源Qwen-72B大模型

阿里云开源了通义千问Qwen-72B(720亿参数)、Qwen-1.8B(18亿参数)以及音频大模型Qwen-Audio,提供对话模型和量化版,支持开发者推理训练。

image.png

体验地址:https://modelscope.cn/studios/qwen/Qwen-72B-Chat-Demo/summary

【AiBase提要:】

🎉 Qwen-72B模型:720亿参数,拥有强大系统指令能力,支持通过提示词定制AI助手。

🗣️ Qwen-1.8B模型:18亿参数,可进行对话任务,提供对话模型和量化版,开发者可在魔搭社区体验下载。

🔊 Qwen-Audio模型: 针对音频,可将语音转换成文本,为大规模音频语言模型领域带来重大突破。

DeepMind发布自监督扩散模型SODA

Google DeepMind发布的自监督扩散模型SODA通过无监督方式精准控制扩散模型,实现风格与内容分离及3D视图生成。

【AiBase提要:】

🔄 模型介绍: DeepMind发布SODA,一种自监督扩散模型,利用图像编码器和去噪解码器实现无监督学习,捕获视觉语义。

🎨 强大生成能力: SODA展示在多个数据集上的强大表示和生成能力,包括线性探测分类、图像重建、新视角合成等实验。

🌐 潜在应用: 该模型不仅在图像生成方面表现出色,还能学习强大的语义表示,为动态组合场景等领域提供新思路。

📰🤖📢AI新鲜事

Meta AI实验室推三项新AI项目

Meta AI实验室庆祝成立十周年,推出Ego-Exo4D视频学习数据集、Seamless Communication语言交流AI模型、以及Audiobox音频生成模型,展示了在增强现实、跨语言交流和音频生成领域的创新成果。

image.png

【AiBase提要:】

🌐 Ego-Exo4D: Meta发布支持视频学习和多模态感知的数据集,覆盖复杂人类活动,如运动、音乐、烹饪,可用于增强现实、机器学习和社交网络。

💬 Seamless Communication: 推出四个AI研究模型,旨在实现更自然、真实的跨语言交流,包括语音表达和语境保留的SeamlessExpressive等功能。

🎶 Audiobox: Meta的新音频生成模型,通过语音输入和自然语言文本提示生成声音和音效,为研究人员提供先进的音频生成研究支持。

海纳AI完成数千万元A轮融资

近日,海纳AI成功获得数千万元A轮融资,由联想创投独家投资。这笔资金将用于人才招募、AI模型研发和营销体系搭建,以提升产品和服务品质,扩大竞争优势。海纳AI在2023年推出基于最新GPT技术的Hina AI2.0大模型,专注于打造AI面试测评平台,服务包括沃尔玛、顺丰、吉利等500强企业,面试人数超过700万。

【AiBase提要:】

🚀 融资成功: 海纳AI获得数千万元A轮融资,由联想创投独家投资。

💡 资金用途: 资金将用于人才招募、AI模型研发、营销体系搭建,提升产品品质和服务竞争优势。

🌐 AI面试服务: 基于最新GPT技术推出的Hina AI2.0大模型,服务包括500强企业,面试人数超过700万。

Sam Altman首次回应Q* 相关问题

经历董事会政变后,Sam Altman回归OpenAI首席执行官,就解雇原因拒绝透露,表示董事会将进行独立审查。

【AiBase提要:】

🔄 复职背后的心路历程: Sam Altman回应董事会请求,表示对公司的热爱和对团队的信任驱使他回归。

❓ 解雇原因成谜: Altman对于自己被解雇的原因保持沉默,董事会将进行独立审查,他欢迎这一决定。

🚀 未来展望: 公司治理结构调整将需要时间,Altman强调对安全工作的承诺,而最近关于Q*模型的突破则未受事件影响。

亚马逊否认计划使用AI完成《Road House》续集

亚马逊否认使用人工智能完成《Road House》续集,与制片人乔尔·席尔弗的指控相悖,强调电影已于2022年10月杀青,不存在在罢工期间使用AI的可能性。

【AiBase提要:】

📰 亚马逊否认计划使用AI制作《Road House》续集,反驳制片人席尔弗的指控。

🎬 制片人因反对在罢工期间使用AI而被开除,亚马逊称指控毫无真实性。

🚫 电影已于2022年10月杀青,亚马逊强调不存在在罢工期间使用AI的可能性。

COLE AI系统利用多模型联合生成高质量设计

一年过去了,微软亚洲研究院和北京大学的研究人员合作开发的COLE AI系统在图形设计领域取得了显著进展。该系统通过多个AI模型的协同作业,为用户提供可编辑的图形设计,不仅生成图像,还能嵌入相关文本,具备可编辑文本和视觉元素的功能。

image.png

论文网址:https://arxiv.org/pdf/2311.16974.pdf

【AiBase提要:】

🌐 COLE采用了Meta的Llama2-13B、DeepFloyd IF、LLaVA1.5-13B和GPT-4V等多个AI模型的组合,通过对互联网上的高质量原始图形设计图像进行训练,实现了出色的设计生成效果。

🖌️ COLE不仅能生成清晰有序的图形设计,还能在图像内生成可编辑的文本和对象区块,为用户提供直接编辑的便捷方式,避免了导出到其他设计软件的繁琐步骤。

🚀 COLE系统在生成各种设计项目时表现出色,研究人员认为它有可能让没有图形设计培训或专业知识的人能够生成与专业设计师媲美的高质量设计。

🤖📱💼AI应用

阿里国际站上线OKKI AI

OKKI AI是面向全行业企业的外贸SaaS工具,以客户管理和辅助决策为核心能力,能帮助外贸商家从琐碎事务中解放出来,提高效率和决策质量。

微信截图_20231201090434.png

【AiBase提要:】

😎 OKKI AI是外贸SaaS工具,主打客户管理和决策辅助,解放商家时间,提高工作效率。

🚀 一键生成开发信、智能客户管理和业务分析是OKKI AI的亮点,受到外贸业务员好评。

📈 对于管理者,OKKI AI提供全盘业务了解,包括订单跟进、客户分布、团队成员报告等,助力决策。

快速绘制,实时推理,tldraw+LCM太好玩啦!

近期,清华发布的潜在一致性模型LCM与fal.ai的API推出的实时绘图工具drawfast结合,通过创新性方法实现了仅需少数几步推理即可高效生成高分辨率图像。drawfast是一款开源协作式数字白板,结合GPT4-Version,用户能在画布上绘制草稿实时生成UI,并复制相关html/css代码,为用户提供了便捷的绘图工具。

image.png

体验地址:https://top.aibase.com/tool/drawfast

【AiBase提要:】

🚀 LCM与drawfast结合,提供用户快速绘制、实时推理的绘图体验。

🖌️ drawfast是一款开源协作式数字白板,搭配GPT4-Version,实时生成UI并提供代码。

💡 用户可在drawfast上产生高效、美观的作品,释放创意潜力,展示工具的创意性和可玩性。

在线图像编辑器miniPaint:开源Photoshop网页最强替代品

miniPaint是一款基于HTML5技术的在线图像编辑器,无需下载安装,直接在浏览器中运行,支持丰富的编辑功能,是Photoshop的强大替代品。

image.png

项目地址:https://github.com/viliusle/miniPaint

【AiBase提要:】

🎨 miniPaint利用HTML5技术,无需下载安装,成为浏览器中的最强在线图像编辑器。

🌐 支持多种图像编辑功能,包括图层、滤镜,操作直接在浏览器中完成,保障用户隐私安全。

🛠️ 项目开源,采用MIT许可证,提供丰富特效和工具,鼓励用户贡献和反馈。

Wombo推AI头像应用程序Wombo Me

Wombo公司推出的新应用Wombo Me,通过一张自拍照片即可迅速生成多个逼真的头像,强调趣味性,支持化身名人、电影角色等,未来计划加入更多互动元素。

【AiBase提要:】

🚀 创新应用发布: Wombo Me由Wombo公司推出,通过一张自拍照片即可快速生成多个逼真头像,相较其他应用更高效。

😄 注重趣味体验: 应用强调趣味性,用户可尝试不同角色,如名人、电影角色,分享到社交媒体展示专业和个性形象。

🌐 未来发展计划: 公司计划引入更多互动元素,如语音和视频,以推动AI在社交媒体内容创造领域更深入的发展。

👨‍💻💡🎯聚焦开发者

昆仑万维发布天工SkyAgents

昆仑万维推出「天工 SkyAgents」AI Agent 开发平台,基于「天工大模型」,支持零代码构建个性化 AI 智能体。适用于个人和企业,实现一键服务部署。

AiBase提要:

🚀 用户可零代码打造私人智能体,基于大模型实现自主学习和模块化任务。

🏢 企业可用于构建个性化应用,包括 IT、智能客服、企业培训、HR、法律顾问等,并支持一键服务部署。

🔄 模块化语言模型和图形界面支持完全无代码操作,用户可以通过自然语言和简单操作进行任务设定和部署。

使用PyTorch加速生成式AI模型

介绍PyTorch团队如何通过本机PyTorch优化加速生成式AI模型,包括Torch.compile编译器、GPU量化、推测性解码和张量并行等技术。

【AiBase提要:】

💻 编译优化: 使用Torch.compile和静态KV缓存减少CPU开销,通过模型编译器提高性能。

🚀 内存带宽优化: 通过INT8仅权重量化缓解内存带宽瓶颈,提高模型推理速度。

🤖 推测性解码: 利用推测解码打破生成过程的串行依赖性,加速权重加载,提高生成速度。

基于大学水平考试的多模态AI测试基准MMMUs发布

最新发布的MMMUs基准挑战GPT-4V等模型,包含六个学科的30个科目,共有1.15万个多模态问题,考察机器在广泛多样任务上的专家级多模态理解和推理能力。

image.png

论文地址:https://arxiv.org/abs/2311.16502

项目网站:https://mmmu-benchmark.github.io/

【AiBase提要:】

🌐 MMMUs基准挑战GPT-4V,包含六个学科30个科目,1.15万多模态问题。

📚 问题设计注重深度,考察感知、知识和推理等基本技能。

🚀 MMMUs作为全面多模态AI测试基准,为评估专家级AGI提供新视角。

举报

  • 相关推荐
  • AI日报:LiblibAI 2.0正式上线;通义千问、豆包开启记忆功能;Sora已登陆Google Play

    本期AI日报聚焦多项重要进展:LiblibAI 2.0上线,内置多模型并提供限时免费算力;通义千问和豆包开启记忆功能内测;OpenAI视频生成应用Sora登陆Google Play并开放北美预注册;Qoder推出提示词增强功能提升开发效率;Cherry Studio集成主流AI模型并推出优惠活动;港中文团队推出首个结构化图像生成系统;DeepSeek入选2025全球十大工程成就。这些突破展示了AI技术快速迭代与多领域应用�

  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

  • 小伙辞去月薪8千工作摆摊日入破千:家人从质疑到支持

    ​近日,一位27岁的张姓青年辞去在宁波每月八千元稳定收入的销售工作,转战武汉街头摆摊售卖麻糍,凭借独特的粉色摊车和美味麻糍,实现了日营业额破千元的佳绩,此事经网络传播后引发广泛关注。 据悉,张同学毕业于湖北交通职业技术学院汽车车身维修技术专业,曾在宁波从事汽车装饰建材销售。日复一日的职场生活让他渐生倦怠,最终决定追寻自由创业之路。他专�

  • 小伙辞月薪8千工作卖麻糍日入1千 日均备货量达200份

    在宁波某企业担任销售员的张同学(化名)近日完成职业转型,通过精准定位高校市场与创新经营模式,其麻糍摊位日均营业额突破千元大关。这场始于辞职决定、历经跨城调研的创业实践,为都市青年职业转型提供了新思路。 2023年初,面对每月8000元固定薪资与重复性工作内容,张同学作出大胆决定:辞去销售岗位,投入1个月时间系统学习烘焙技术。初期在宁波尝试摆摊时�

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 通义千问官方App在哪下载 通义千问2.0有哪些升级

    通义千问已经发布了2.0版本,2.0版本在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升,以下我们来看下通义千问2.0版本升级的功能。通义千问2.0在各方面的能力都有了巨大的进步,相比于今年4月推出的1.0版本,通义千问2.0在复杂命令处理、文艺创作、通用数学、知识储存、幻觉防御等方面都有了显著的提高。截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。

  • 通义千问先“问”钉钉

    2023年钉钉生态大会,能替代真人参会的“数字分身”亮相,一同出现的还有帮助教师批改作业的“AI小助教”及企业的AI招聘专员。这些“数智人”同事以钉钉为入口,进入现实工作场景。钉钉用AI脱胎换骨的做法也表明,有应用的生态更容易AI化。

  • 巨量千川双11战报出炉!销售额破千万的商品数同比增长100%

    双11第一阶段战报出炉:巨量千川助力商家实现销售爆发,销售额破千万商品数量同比增长100%,使用智能优惠券的商家订单数提升110%。AI服务帮助提升经营效率,多个行业品牌借助全域推广工具实现GMV大幅增长,如派派净成交GMV提升400%。活动仍在火热进行中,商家可把握流量扶持机会实现全域生意增长。

  • 《在千年滕王阁发布科技产品:前行者的科技+文化+情绪伙伴新融合》

    10月18日,外设品牌前行者在南昌滕王阁举办新品发布会,推出多款高端定制键盘、鼠标及虚拟歌姬洛天依联名款X87键盘,以技术创新与跨界合作重新定义行业标准。发布会核心包括品牌战略升级、产品矩阵革新,覆盖电竞、文化、女性设计等多场景,并完成从硬件制造商向“科技+文化+情绪伙伴”生态构建者的转型。通过电竞合作、虚拟偶像联名等跨界实践,彰显国风科技定位,推动输入设备体验变革。

  • 爸爸回应辞职带休学儿子徒步千里:孩子眼神已变得“有光”

    ​近日,湖北一位父亲余先生(部分报道称景先生)的特殊育儿经历引发社会关注。其9岁儿子小景患有注意缺陷多动障碍(ADHD),表现为学习困难、情绪敏感、身体协调性差,而余先生自身也曾是ADHD患者。为避免儿子重蹈自己成长中的困境,三年前余先生毅然辞去月入2万元的工作,今年3月更是为小景办理了休学手续,并报名每月费用高达2万元的特训营。然而,因在教育理念上

今日大家都在搜的词: