首页 > 业界 > 关键词  > 通义千问最新资讯  > 正文

AI视野:通义千问发布Qwen1.5;背景分割开源模型RMBG v1.4来了;OpenAI 为 DALL-E3添加新水印;苹果图片项目MGIE上线试玩

2024-02-07 14:16 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240207142755.png

🤖📱💼AI应用

通义千问团队发布Qwen1.5聊天模型性能大幅提升

【AiBase提要】

⭐ 模型多样性: 提供6个不同规模的模型,满足各种需求

⭐ 生态系统融入: 与主流框架合并,简化开发流程

⭐ 卓越性能: 聊天模型性能显著提升,基准测试表现优秀

体验地址:https://modelscope.cn/studios/qwen/Qwen1.5-72B-Chat-Demo/summary

remove bg最强平替?新背景分割开源模型RMBG v1.4来了

image.png

【AiBase提要:】

🌟 RMBG v1.4效果出色,受到好评

🌟 经过专业数据集训练,适用于商业用例

🌟 有望成为行业翘楚,提供更好体验

模型下载地址:https://top.aibase.com/tool/rmbg-v1-4

苹果文字编辑图像项目MGIE可以试玩了

image.png

【AiBase提要】

🌟局部特写的图片处理效果较好

🌟环境稍微复杂一些的图像瑕疵明显

🌟禁止对人像进行任何形式的修改

试玩地址:https://huggingface.co/spaces/tsujuifu/ml-mgie

视频新技术!Anything in Any Scene可以在视频中无缝插入任何物体

image.png

【AiBase提要】

⭐ 先进物体识别和场景理解算法

⭐ 光照条件分析与模拟,被添加物体和原视频完美融合

⭐ 应用风格转换技术,使得插入的物体色彩、纹理等与视频背景保持一致

项目及演示:https://top.aibase.com/tool/anything-in-any-scene

腾讯发布视频生成模型DynamiCrafter高分辨率文件

image.png

【AiBase提要:】

⭐腾讯发布了视频生成模型DynamiCrafter的高分辨率文件。

⭐该版本的模型比SVD的动态幅度更大,在稳定性方面表现良好。

⭐DynamiCrafter可根据文本提示将静态图像转换为动态视频。

项目页:https://top.aibase.com/tool/dynamicrafter

试玩地址:https://huggingface.co/spaces/Doubiiu/DynamiCrafter

生成式AI公司Galileo推出检索增强生成工具

【AiBase提要:】

⚙️ RAG系统添加领域特定上下文提供领域特定结果

🔄 Galileo工具嵌入用户工作流提供可见性和快速评估

🔍 企业可信赖AI解决方案的开发利器

谷歌推出ASPIRE框架 让大模型具备自我判断意识

【AiBase提要:】

⭐️ 基于自我评估的选择性预测

⭐️ 任务定向微调、答案采样、自我评估学习

⭐️ ASPIRE框架在多个数据集上表现良好

论文地址:https://aclanthology.org/2023.findings-emnlp.345.pdf

OpenAI对ChatGPT、API生成的图片,嵌入C2PA元数据

图片

【AiBase提要:】

⭐️ 图片嵌入C2PA元数据,防止非法使用

⭐️ C2PA标准允许跟踪和验证数字内容

⭐️ 针对AI生成图片提升辨识度

识别AI图片网站:https://contentcredentials.org/verify

📰🤖📢AI新鲜事

AI工具哪家强?ChatGPT位居榜首,每月用户数超过Netflix

【AiBase提要:】

⭐️ ChatGPT以16.7亿用户数稳居榜首

⭐️ Grammarly AI、Character.AI等工具也表现优异

⭐️ 大型科技公司在生成式AI行业垄断引起关注

Meta承诺在Facebook和Instagram上标注AI生成的图像

【AiBase提要:】

⭐ Meta承诺标注AI生成的内容

⭐ 与行业合作伙伴制定技术标准

⭐ 举措被认为是对虚假内容问题的回应

OnlyFake提供15美元AI工具包制作假证件

【AiBase提要:】

⚠️ OnlyFake提供AI工具包制作逼真假证件

⚠️ 伪造文件绕过加密货币交易所KYC验证

⚠️ 专家呼吁加强网络安全措施

举报

  • 相关推荐
  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • 极氪接入通义千问3,知识库问答命中率达98%

    极氪汽车接入通义千问3大模型,打造专属知识库"极氪知道",问答准确率达98%。基于阿里云平台调用Qwen3-235B-A22B大模型,构建图文视三位一体的知识呈现系统,可提供标准化文本介绍及多媒体资源。通义千问3的快慢思考融合架构能提供更富逻辑性的车辆对比介绍,提升客户决策体验。极氪车联网、APP等核心业务已运行在阿里云平台。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

    本期AI日报聚焦多项AI领域创新:1)MiniMax推出视频Agent工具,支持文本生成高清视频及人脸驱动;2)昆仑万维开源Skywork-SWE-32B模型,提升软件工程任务表现;3)B站接入通义千问模型,推出数据分析智能体InsightAgent;4)ChatGPT深度整合Gmail与日历功能;5)腾讯云发布全链路AI开发平台"AI Builder";6)HeyGen推出UGC广告数字人功能;7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态,展现AI技术快速发展的多元应用与潜在影响。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • Meta V-JEPA 2模型来袭,OpenAI/微美全息AI创新跃升赋能千行百业变革

    Meta推出开源模型V-JEPA2,帮助AI理解3D环境和物理规律;OpenAI发布最强推理模型o3-pro,在数学测试中超越Google Gemini2.5Pro;苹果宣布将推出全新智能模型,扩展语言支持并开放开发者访问;微美全息凭借技术积累在大模型、多模态智能等领域取得突破。全球科技巨头加速布局AI前沿领域,推动AI与教育、金融等重点行业深度融合,赋能产业升级。

  • AI日报:即梦灰测图片3.1模型;ElevenLabs推出AI语音助理11ai;百度发布多智能体协同AI IDE

    本文介绍了AI领域多项最新进展:1)即梦灰测图片3.1模型增强电影感和艺术风格;2)ElevenLabs推出语音助手11ai;3)文心快码发布多模态AI开发工具Comate AI IDE;4)苹果采用"归一化流"技术开发新型AI生图模型;5)Grok将推出整合多类型文件管理功能;6)OmniGen2开源多模态模型重塑AI应用场景;7)ScholAI革新学术研究工具;8)豆包推出可视化AI编程功能;9)饿了么推出骑手AI助手"小饿";10)张雪峰认为AI可替代部分教育工作;11)微软发布3.3亿参数小模型Mu。这些创新展示了AI技术在各领域的快速发展和应用潜力。