首页 > 业界 > 关键词  > 通义千问最新资讯  > 正文

AI视野:阿里云开源Qwen-72B大模型;Meta推三项新AI项目;Sam Altman回应Q* 相关问题;天工SkyAgents发布

2023-12-01 15:17 · 稿源:站长之家

🤖📈💻💡大模型动态

阿里云开源Qwen-72B大模型

阿里云开源了通义千问Qwen-72B(720亿参数)、Qwen-1.8B(18亿参数)以及音频大模型Qwen-Audio,提供对话模型和量化版,支持开发者推理训练。

image.png

体验地址:https://modelscope.cn/studios/qwen/Qwen-72B-Chat-Demo/summary

【AiBase提要:】

🎉 Qwen-72B模型:720亿参数,拥有强大系统指令能力,支持通过提示词定制AI助手。

🗣️ Qwen-1.8B模型:18亿参数,可进行对话任务,提供对话模型和量化版,开发者可在魔搭社区体验下载。

🔊 Qwen-Audio模型: 针对音频,可将语音转换成文本,为大规模音频语言模型领域带来重大突破。

DeepMind发布自监督扩散模型SODA

Google DeepMind发布的自监督扩散模型SODA通过无监督方式精准控制扩散模型,实现风格与内容分离及3D视图生成。

【AiBase提要:】

🔄 模型介绍: DeepMind发布SODA,一种自监督扩散模型,利用图像编码器和去噪解码器实现无监督学习,捕获视觉语义。

🎨 强大生成能力: SODA展示在多个数据集上的强大表示和生成能力,包括线性探测分类、图像重建、新视角合成等实验。

🌐 潜在应用: 该模型不仅在图像生成方面表现出色,还能学习强大的语义表示,为动态组合场景等领域提供新思路。

📰🤖📢AI新鲜事

Meta AI实验室推三项新AI项目

Meta AI实验室庆祝成立十周年,推出Ego-Exo4D视频学习数据集、Seamless Communication语言交流AI模型、以及Audiobox音频生成模型,展示了在增强现实、跨语言交流和音频生成领域的创新成果。

image.png

【AiBase提要:】

🌐 Ego-Exo4D: Meta发布支持视频学习和多模态感知的数据集,覆盖复杂人类活动,如运动、音乐、烹饪,可用于增强现实、机器学习和社交网络。

💬 Seamless Communication: 推出四个AI研究模型,旨在实现更自然、真实的跨语言交流,包括语音表达和语境保留的SeamlessExpressive等功能。

🎶 Audiobox: Meta的新音频生成模型,通过语音输入和自然语言文本提示生成声音和音效,为研究人员提供先进的音频生成研究支持。

海纳AI完成数千万元A轮融资

近日,海纳AI成功获得数千万元A轮融资,由联想创投独家投资。这笔资金将用于人才招募、AI模型研发和营销体系搭建,以提升产品和服务品质,扩大竞争优势。海纳AI在2023年推出基于最新GPT技术的Hina AI2.0大模型,专注于打造AI面试测评平台,服务包括沃尔玛、顺丰、吉利等500强企业,面试人数超过700万。

【AiBase提要:】

🚀 融资成功: 海纳AI获得数千万元A轮融资,由联想创投独家投资。

💡 资金用途: 资金将用于人才招募、AI模型研发、营销体系搭建,提升产品品质和服务竞争优势。

🌐 AI面试服务: 基于最新GPT技术推出的Hina AI2.0大模型,服务包括500强企业,面试人数超过700万。

Sam Altman首次回应Q* 相关问题

经历董事会政变后,Sam Altman回归OpenAI首席执行官,就解雇原因拒绝透露,表示董事会将进行独立审查。

【AiBase提要:】

🔄 复职背后的心路历程: Sam Altman回应董事会请求,表示对公司的热爱和对团队的信任驱使他回归。

❓ 解雇原因成谜: Altman对于自己被解雇的原因保持沉默,董事会将进行独立审查,他欢迎这一决定。

🚀 未来展望: 公司治理结构调整将需要时间,Altman强调对安全工作的承诺,而最近关于Q*模型的突破则未受事件影响。

亚马逊否认计划使用AI完成《Road House》续集

亚马逊否认使用人工智能完成《Road House》续集,与制片人乔尔·席尔弗的指控相悖,强调电影已于2022年10月杀青,不存在在罢工期间使用AI的可能性。

【AiBase提要:】

📰 亚马逊否认计划使用AI制作《Road House》续集,反驳制片人席尔弗的指控。

🎬 制片人因反对在罢工期间使用AI而被开除,亚马逊称指控毫无真实性。

🚫 电影已于2022年10月杀青,亚马逊强调不存在在罢工期间使用AI的可能性。

COLE AI系统利用多模型联合生成高质量设计

一年过去了,微软亚洲研究院和北京大学的研究人员合作开发的COLE AI系统在图形设计领域取得了显著进展。该系统通过多个AI模型的协同作业,为用户提供可编辑的图形设计,不仅生成图像,还能嵌入相关文本,具备可编辑文本和视觉元素的功能。

image.png

论文网址:https://arxiv.org/pdf/2311.16974.pdf

【AiBase提要:】

🌐 COLE采用了Meta的Llama2-13B、DeepFloyd IF、LLaVA1.5-13B和GPT-4V等多个AI模型的组合,通过对互联网上的高质量原始图形设计图像进行训练,实现了出色的设计生成效果。

🖌️ COLE不仅能生成清晰有序的图形设计,还能在图像内生成可编辑的文本和对象区块,为用户提供直接编辑的便捷方式,避免了导出到其他设计软件的繁琐步骤。

🚀 COLE系统在生成各种设计项目时表现出色,研究人员认为它有可能让没有图形设计培训或专业知识的人能够生成与专业设计师媲美的高质量设计。

🤖📱💼AI应用

阿里国际站上线OKKI AI

OKKI AI是面向全行业企业的外贸SaaS工具,以客户管理和辅助决策为核心能力,能帮助外贸商家从琐碎事务中解放出来,提高效率和决策质量。

微信截图_20231201090434.png

【AiBase提要:】

😎 OKKI AI是外贸SaaS工具,主打客户管理和决策辅助,解放商家时间,提高工作效率。

🚀 一键生成开发信、智能客户管理和业务分析是OKKI AI的亮点,受到外贸业务员好评。

📈 对于管理者,OKKI AI提供全盘业务了解,包括订单跟进、客户分布、团队成员报告等,助力决策。

快速绘制,实时推理,tldraw+LCM太好玩啦!

近期,清华发布的潜在一致性模型LCM与fal.ai的API推出的实时绘图工具drawfast结合,通过创新性方法实现了仅需少数几步推理即可高效生成高分辨率图像。drawfast是一款开源协作式数字白板,结合GPT4-Version,用户能在画布上绘制草稿实时生成UI,并复制相关html/css代码,为用户提供了便捷的绘图工具。

image.png

体验地址:https://top.aibase.com/tool/drawfast

【AiBase提要:】

🚀 LCM与drawfast结合,提供用户快速绘制、实时推理的绘图体验。

🖌️ drawfast是一款开源协作式数字白板,搭配GPT4-Version,实时生成UI并提供代码。

💡 用户可在drawfast上产生高效、美观的作品,释放创意潜力,展示工具的创意性和可玩性。

在线图像编辑器miniPaint:开源Photoshop网页最强替代品

miniPaint是一款基于HTML5技术的在线图像编辑器,无需下载安装,直接在浏览器中运行,支持丰富的编辑功能,是Photoshop的强大替代品。

image.png

项目地址:https://github.com/viliusle/miniPaint

【AiBase提要:】

🎨 miniPaint利用HTML5技术,无需下载安装,成为浏览器中的最强在线图像编辑器。

🌐 支持多种图像编辑功能,包括图层、滤镜,操作直接在浏览器中完成,保障用户隐私安全。

🛠️ 项目开源,采用MIT许可证,提供丰富特效和工具,鼓励用户贡献和反馈。

Wombo推AI头像应用程序Wombo Me

Wombo公司推出的新应用Wombo Me,通过一张自拍照片即可迅速生成多个逼真的头像,强调趣味性,支持化身名人、电影角色等,未来计划加入更多互动元素。

【AiBase提要:】

🚀 创新应用发布: Wombo Me由Wombo公司推出,通过一张自拍照片即可快速生成多个逼真头像,相较其他应用更高效。

😄 注重趣味体验: 应用强调趣味性,用户可尝试不同角色,如名人、电影角色,分享到社交媒体展示专业和个性形象。

🌐 未来发展计划: 公司计划引入更多互动元素,如语音和视频,以推动AI在社交媒体内容创造领域更深入的发展。

👨‍💻💡🎯聚焦开发者

昆仑万维发布天工SkyAgents

昆仑万维推出「天工 SkyAgents」AI Agent 开发平台,基于「天工大模型」,支持零代码构建个性化 AI 智能体。适用于个人和企业,实现一键服务部署。

AiBase提要:

🚀 用户可零代码打造私人智能体,基于大模型实现自主学习和模块化任务。

🏢 企业可用于构建个性化应用,包括 IT、智能客服、企业培训、HR、法律顾问等,并支持一键服务部署。

🔄 模块化语言模型和图形界面支持完全无代码操作,用户可以通过自然语言和简单操作进行任务设定和部署。

使用PyTorch加速生成式AI模型

介绍PyTorch团队如何通过本机PyTorch优化加速生成式AI模型,包括Torch.compile编译器、GPU量化、推测性解码和张量并行等技术。

【AiBase提要:】

💻 编译优化: 使用Torch.compile和静态KV缓存减少CPU开销,通过模型编译器提高性能。

🚀 内存带宽优化: 通过INT8仅权重量化缓解内存带宽瓶颈,提高模型推理速度。

🤖 推测性解码: 利用推测解码打破生成过程的串行依赖性,加速权重加载,提高生成速度。

基于大学水平考试的多模态AI测试基准MMMUs发布

最新发布的MMMUs基准挑战GPT-4V等模型,包含六个学科的30个科目,共有1.15万个多模态问题,考察机器在广泛多样任务上的专家级多模态理解和推理能力。

image.png

论文地址:https://arxiv.org/abs/2311.16502

项目网站:https://mmmu-benchmark.github.io/

【AiBase提要:】

🌐 MMMUs基准挑战GPT-4V,包含六个学科30个科目,1.15万多模态问题。

📚 问题设计注重深度,考察感知、知识和推理等基本技能。

🚀 MMMUs作为全面多模态AI测试基准,为评估专家级AGI提供新视角。

举报

  • 相关推荐
  • 大家在看
  • Snap Video:Snap视频用于文本到视频合成的可扩展空间时间转换器

    Snap视频是一个视频优先的模型,通过延伸EDM框架系统地解决视频生成域中的运动保真度、视觉质量和可扩展性等挑战。该模型利用帧间的冗余信息,提出了一个可伸缩的transformer架构,将空间和时间维度作为一个高度压缩的1D潜在向量,从而有效地进行空间时间联合建模,合成时间连贯性强、运动复杂的视频。这种架构使模型可以高效训练,达到数十亿参数规模,在多项基准测试中取得最优效果。

  • Differential Diffusion:让每个像素根据指定地图的强度变化

    Differential Diffusion是一个图像生成和编辑的平台,可以根据文本提示以及指定每个区域变化量的地图来修改图片。它能够为每个像素或图像区域提供定制化的变化量控制。这种细粒度的变化量控制为各种新的编辑能力打开了大门,例如控制个别对象被修改的程度,或者引入渐变的空间变化等。此外,该平台展示了该框架在图像补全领域的有效性,即在无缝融合新的内容时微调周边区域。它还提供了探索不同变化量效果的新工具。该框架仅在推理时运行,不需要模型训练或微调。展示了它与当前最先进的开源模型的集成效果,并通过定量、定性比较和用户研究进行了验证。

  • OgtAI:AI聊天系统,与任何媒体类型进行对话

    Ogt.ai是一款先进的AI聊天系统,可以与任何媒体类型进行对话。它可以与YouTube视频、音频文件、文本文档和链接进行交互式对话,提供更加智能、直观的媒体体验。Ogt.ai能够分析内容、提问问题并实时获取洞见,使媒体交互更加有趣和信息丰富。它还可以与PDF、文本、JSON、CSV、DOCX和PPTX等基于文本的文档进行对话,提取关键信息或像与专家交谈一样讨论内容。Ogt.ai能够识别各种媒体的细微差别,并根据视频情绪、文档上下文或关键音频点调整回答,提升媒体交互体验。

  • SoraHub:OpenAI Sora创意视频和提示词聚合平台

    SoraHub是一个聚合展示OpenAI Sora平台生成的各种创意视频和提示词的网站。用户可以在网站上探索最新的Sora生成视频,一站式体验OpenAI前沿AI的强大创意能力。网站定期更新各类有趣、实用的Sora创意内容。用户还可以在网站订阅邮件列表,随时获取Sora的更新资讯。

  • Sora Prompts:Sora是OpenAI推出的一款基于NLP的视频生成工具

    Sora是一个利用自然语言处理技术生成视频的AI模型。它能够根据使用者的文字提示生成高质量、连贯性强的视频,长度可达1分钟。Sora最大的优势在于生成视频的质量高,可控性强,同时也具有创意性。定价方面,Sora目前还在内测阶段,暂未公布具体定价,定位是面向影视制作人、设计师等创意人群。

  • Finpilot:人工智能助手,帮助金融分析师提高工作效率

    Finpilot是一个人工智能助手,专为金融分析师设计,可以帮助他们快速搜集和分析金融数据、编写报告以及进行数据可视化,大大提高工作效率。它可以自动化搜集和分析公开的财务数据,节省大量手动工作时间,同时提供可验证的信息来源,保证研究质量。用户只需与Finpilot聊天即可获得直接的答复和可靠的洞见,从而简化金融分析工作流程。

  • HomeworkAI:智能作业助手,快速解答

    HomeworkAI是一款智能作业助手,提供详细的逐步解答,涵盖各个学科。通过HomeworkAI,您可以轻松应对繁重的作业和棘手的任务,实现无压力的学习,提高成绩。

  • OpenCodeInterpreter:集代码生成与执行于一体的开源系统

    OpenCodeInterpreter是一个开源的代码生成系统,将代码生成、执行和迭代优化结合在一起。它利用包含6.8万段交互的Code-Feedback数据集进行训练,可以根据执行输出和人类反馈对代码进行动态优化。在HumanEval、MBPP等基准测试上的评估显示了它在代码生成方面的突出表现。具有33B参数量的OpenCodeInterpreter在HumanEval和MBPP的平均准确率可达83.2%,与GPT-4代码解释器的84.2%不相上下,并可通过人工反馈提升至91.6%。OpenCodeInterpreter缩小了开源代码生成模型与GPT-4等专有系统之间的差距。

  • Walle:您的一站式AI助手和浏览器扩展

    Walle是您的一站式AI助手和浏览器扩展,集成于Chrome、Safari和Edge浏览器。它提供聊天机器人、AI阅读器、AI写手、聊天PDF、图片创作与图像阅读等功能。Walle支持写作辅助、知识查询、文本概括、翻译摘要、图像生成等多种场景,助您提升效率和创造力。

  • NameHassle:域名生成器

    NameHassle是世界上最受欢迎的免费人工智能域名生成器。使用NameHassle的域名生成器即可立即获得最佳的商业域名创意!

  • Convert image to mindmap:将图像转换为思维导图的在线工具

    Image2MindMap是一款先进的在线工具,可将图像转换为结构化的思维导图。它利用先进的图像识别技术分析并提取图像中的文本信息,然后自动生成初步的思维导图结构。用户可以轻松自定义导图节点,添加、编辑或删除节点,确保思维导图准确反映其想法。Image2MindMap的主要功能包括:上传图像、文本提取、自动映射、自定义节点、附加图像等。它适用于多种场景,可以帮助用户快速转换图像中的想法和概念为结构化的思维导图。

  • Best Man Pro:定制化的伴郎致辞助手

    Best Man Pro是一款定制化的伴郎致辞助手。它可以帮助你轻松准备一份感人的伴郎致辞,让你的致辞在婚礼上留下深刻的印象。你只需花费五分钟的时间,按照我们的指南创建致辞大纲,然后我们的人工智能助手将生成三份可供选择的致辞。无论你想表达什么,我们的助手都能帮你找到恰当的表达方式。购买价格为19.99美元,包括三份完整的致辞,并提供14天的100%退款保证。

  • Push Lap Wholesale:最佳和最准确的亚马逊批发扫描工具

    PushLap Wholesale是亚马逊批发扫描工具中最好和最准确的选择。通过快速扫描供应商提供的价格列表,你可以找到最优质的产品。省时、准确计算利润、精确预测需求、智能匹配产品标题、描述和品牌信息等功能,助你轻松达到每月的采购目标,让你的亚马逊FBA业务持续增长。

  • UseSora:最佳文案生成工具

    Sora是一款强大的文案生成工具,通过AI算法生成优质的文案内容,提供多语言支持,每日更新。具有简单易用、高效准确、多样化等优势。定价灵活,可根据需求选择不同套餐。定位于提供最佳的文案生成解决方案。

  • Grabtext:免费在线OCR和AI图像转文字

    GrabText是一款免费在线OCR工具,可以将手写笔记、数学公式和打印文字转换为可编辑的数字内容。支持从图片、纸张、收据、PPT和书籍中转录。可将手写的想法精确转换为Latex公式。

  • SoraPrompt:从文本生成视频

    SoraPrompt是一种AI模型,可以根据文本指令创建逼真且富有想象力的场景。它利用Sora技术生成视频查询摘要,用于高效的内容分析。SoraPrompt基于最新的openai技术,可以生成各种类型的视频,如水族馆、纽约市、后退慢跑者、篮球爆炸、大溪地等。用户可以根据自己的兴趣和想法与SoraPrompt互动。

  • U:计算机视觉自动化和RPA工具

    U-xer是一款基于计算机视觉的测试自动化和RPA工具,旨在自动化屏幕上看到的任何内容,包括Web和桌面应用程序。它具有易用和高级两种模式,可以满足非技术用户和高级用户的不同需求。U-xer能够识别屏幕,像人类一样解释屏幕内容,实现更自然、准确的自动化。它适用于各种应用场景,包括Web应用程序、桌面软件、移动设备等,并提供定制化解决方案。U-xer的定价和定位请查看官方网站。

  • TogetherForm:实时协作表单

    TogetherForm是一个实时协作表单工具,可以让团队成员共同填写和编辑表单。它将每个字段都转化为一个迷你的Google文档,使得团队可以在表单中进行协作。无需复制到Google Docs,你可以直接在TogetherForm中协作编辑你的YC申请。TogetherForm提供免费试用,无需注册或付费。

  • sora ai webui:一键生成视频

    Sora AI是基于Sora的网络工具,使用OpenAI的Sora模型,用户可以轻松地通过文本生成视频。Sora AI具有以下功能:1. 通过简单的文本生成高质量的视频内容;2. 支持多种主题和风格的视频生成;3. 快速生成视频,提高工作效率;4. 可自定义视频元素和配乐;5. 灵活的定价计划,满足不同需求。

  • AIMath:数学AI求解器

    AI Math是一款在线免费的数学AI求解器,能够帮助您解决各种数学问题。它支持解决算术、代数、几何、三角、微积分、组合、统计概率等各类数学问题。通过AI Math,您可以获得准确的解答,并且详细的步骤说明能够帮助您更好地理解和掌握数学知识。AI Math具有99%的准确率,支持30种语言,随时随地提供24/7的在线服务。

今日大家都在搜的词: