首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:kimi宣布降价;OpenRouter发布免费模型Quasar Alpha;Midjourney V7重磅上线

2025-04-07 15:41 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、IDC:到2028年中国人工智能投资将突破1000亿美元

根据国际数据公司(IDC)的预测,中国在人工智能领域的投资将显著增长,预计到2028年总投资将突破1000亿美元,年均复合增长率达到35.2%。与此同时,全球人工智能市场也在快速扩张,尤其是生成式AI领域,预计到2028年市场规模将达到2842亿美元,成为整体AI市场的重要组成部分。

image.png

【AiBase提要:】

💡 全球生成式 AI 市场预计到2028年将达2842亿美元,占整体 AI 市场的35%。

🚀 中国人工智能总投资预计到2028年将突破1000亿美元,年均复合增长率为35.2%。

🔧 软件和信息服务行业是人工智能投资最多的领域,预计到2028年占比将达到49.8%。

2、Midjourney V7正式发布:最美观、最连贯的模型

Midjourney V7的发布标志着AI图像生成技术的又一重要进步。作为最新的图像模型,V7在图像质量、连贯性和用户个性化体验上均有显著提升。新功能如草稿模式和默认个性化设置,使得用户在创作中更加高效和灵活。未来的更新计划也将进一步扩展V7的功能,推动AI与创意工作的深度融合。

【AiBase提要:】

🚀 V7推出草稿模式,渲染速度提升10倍,成本减半,适合快速原型设计。

🎨 新模型在细节处理上表现出色,特别是在复杂元素的连贯性和分辨率上有显著提升。

🔧 默认启用个性化功能,用户可通过评级图片来调整模型输出,增强独特体验。

3、Quasar Alpha神秘亮相:首款“隐秘”长上下文模型开启免费体验

Quasar Alpha是一款新推出的AI模型,以其超长的100万token上下文处理能力和优化的编码能力引起了广泛关注。该模型的设计兼顾专业性与通用性,适用于多种应用场景,尤其在编程领域表现出色。它的免费开放策略不仅降低了使用门槛,还为开发者提供了宝贵的试用机会。

image.png

【AiBase提要:】

🚀 Quasar Alpha具备100万token的超长上下文处理能力,适合复杂推理和深度理解任务。

💻 该模型优化了编码能力,能够高效生成高质量代码,并在多语言编码基准测试中表现优异。

🌐 目前已通过OpenRouter等平台免费开放,用户可轻松集成到开发环境中,体验其强大功能。

详情链接:https://openrouter.ai/chat

4、谷歌发布 Gemini2.5Pro API,比GPT-4o更便宜

谷歌最近推出了其最新的旗舰人工智能模型Gemini2.5Pro,声称这是有史以来最智能的模型。该模型通过Gemini API在Google AI Studio上进行公开预览,并将很快在Vertex AI上线。其极具竞争力的定价策略吸引了众多开发者的关注,Gemini2.5Pro的定价为每百万输入tokens仅1.24美元,远低于竞争对手的价格。

image.png

【AiBase提要:】

🚀 Gemini2.5Pro被誉为“有史以来最智能的模型”,在推理能力和逻辑推理方面表现卓越。

💰 该模型的定价为每百万输入tokens仅1.24美元,远低于竞争对手如OpenAI和Anthropic的定价。

📈 谷歌通过公开预览收集开发者反馈,推动AI技术的广泛应用,并引领行业降本增效的新潮流。

5、MagicColor:AI一键自动帮线稿上色 多角色图也能精确分区域上色

MagicColor是一款创新的AI工具,能够快速为线稿图像自动上色。用户只需上传黑白线稿和参考图像,系统便能在数秒内完成色彩填充。其强大的图像识别与生成算法确保了色彩的精准匹配,特别适合动漫设计师和插画师使用。该工具的灵活性和高效性为创作者节省了大量时间,推动了数字艺术的智能化发展。

image.png

【AiBase提要:】

🖌️ MagicColor通过一键式上色流程,用户只需上传线稿和参考图像,便可自动生成彩色图像。

🌈 该工具支持多种风格的参考图像,用户可自由探索不同画风与色调的结合,增强创作个性。

⏱️ MagicColor的快速生成能力让创作者节省时间,能够将更多精力投入到创意构思中。

详情链接:https://yinhan-zhang.github.io/color/

6、Luma推出Ray2相机运动概念功能:AI视频迈向电影级镜头控制新境界

Luma最近发布的Ray2模型更新引入了相机运动概念,提供了20多种专业级摄像机运动模式,显著提升了AI生成视频的艺术性与精确性。这一创新不仅为广告和影视预览等领域开辟了新可能性,也解决了AI视频生成中的镜头运动自然性与可控性问题。用户可以通过简单的文本指令自由组合镜头运动,创造出复杂的动态效果,极大地增强了视频创作的灵活性与效率。

【AiBase提要:】

📹 Ray2引入20多种摄像机运动模式,提升AI生成视频的专业水平。

🎬 用户可通过简单文本组合多种镜头运动,实现复杂效果。

💡 该功能解决了AI视频生成中的镜头运动自然性与可控性问题。

7、一周数据干翻七年苦练?微软模型WHAMM实时生成《雷神之锤II》可玩Demo

微软推出的WHAMM模型展示了生成式AI在游戏开发中的潜力,通过实时生成可玩的《雷神之锤II》演示,标志着AI技术的重大突破。尽管存在一些技术局限性,如环境生成的模糊和输入延迟,但WHAMM在数据学习和图像生成策略上的创新为未来的AI辅助游戏开发开辟了新方向,预示着游戏产业将迎来更多的自动化工具。

【AiBase提要:】

🕹️ WHAMM模型能够从零开始生成整个游戏环境,允许玩家实时互动。

⚡ 相比于前版本,WHAMM在性能上实现显著飞跃,生成速度超过每秒十帧。

🔍 尽管WHAMM展示了潜力,但仍存在技术局限,如敌方角色模糊和输入延迟问题。

8、腾讯ARC实验室出品!AnimeGamer打造无限动漫人生模拟器

腾讯ARC实验室与香港城市大学联合推出的AnimeGamer是一款创新的动漫人生模拟工具,能够实现无限的动漫角色互动和游戏状态预测。通过自然语言指令,用户可以沉浸在自己喜爱的动漫世界中,体验角色之间的梦幻联动。

image.png

【AiBase提要:】

🎬 AnimeGamer提供无限长度的动画视频,用户可以通过自然语言与角色互动。

🌟 角色跨作品联动成为可能,打破次元壁,创造独特场景。

🤖 采用多模态大语言模型,提升动画生成质量,展现强大的泛化能力。

详情链接:https://top.aibase.com/tool/animegamer

9、OpenAI 考虑收购 Jony Ive 设计的 AI 设备初创公司io Products

OpenAI正在考虑收购初创公司io Products,该公司由知名设计师Jony Ive与OpenAI首席执行官Sam Altman合作开发,专注于研发基于人工智能的个人设备。此举可能会改变用户与技术的互动方式,同时助力OpenAI在个人智能设备市场的扩展。

【AiBase提要:】

🌟 OpenAI正在讨论收购初创公司io Products,该公司由Jony Ive和Sam Altman合作开发AI设备。

🤖 io Products专注于研发基于人工智能的个人设备,可能会改变用户与技术的互动方式。

🚀 收购成功后,OpenAI将获得io Products团队及其正在研发的设备,助力公司在个人智能设备市场的扩展。

10、OpenAI 为 GPT-4o 图像生成添水印,Plus 会员享特权

OpenAI 正在为其 GPT-4o 图像生成模型添加水印,旨在规范用户使用和保护版权。此功能最初仅面向 ChatGPT Plus 用户,现已向所有用户开放。免费用户生成的图像将带有水印,而 Plus 会员则可以保存无水印版本。OpenAI 同时确认正在开发 ImageGen API,未来开发者将能利用该接口构建应用程序。

【AiBase提要:】

💧 OpenAI 正在为 GPT-4o 模型添加水印,以规范用户使用和保护版权。

🎨 生成的图像不仅具备美学效果,还能够模仿著名动画公司的艺术风格。

🔧 OpenAI 正在开发 ImageGen API,未来将为开发者提供更多应用可能性。

11、字节跳动登记即梦AI 作品著作权

近日,北京字跳网络技术有限公司在知识产权领域取得了显著进展,成功登记了“即梦 AI/Dreamina AI”的美术作品著作权。这一里程碑为公司的创意产业探索奠定了坚实的基础。即梦 AI 作为一款创新产品,旨在为创意爱好者提供多功能平台,支持AI图片创作和视频制作。

【AiBase提要:】

🎨 北京字跳网络技术有限公司成功登记了“即梦 AI/Dreamina AI”的美术作品著作权。

🚀 即梦 AI 是一款创新产品,旨在为创意爱好者提供多功能平台,支持AI图片创作和视频制作。

📈 公司的著作权登记不仅认可了其技术实力,也为未来发展奠定了基础。

12.Kimi开放平台宣布价格调整:模型推理服务与上下文缓存双双降价

Kimi开放平台正式发布公告,宣布基于Moonshot AI一年来的技术积累和性能优化,对平台提供的模型推理服务价格进行调整,同时大幅下调上下文缓存价格。

亮点提要:

🚀 Kimi 开放平台基于过去一年技术优化,全面下调模型推理服务价格,提高用户使用的性价比。

💡 上下文缓存价格大幅下调,使企业和开发者在处理长文本任务时能更经济高效。

📊 Kimi 平台以超长上下文处理能力为核心竞争力,广泛应用于多种文档分析和开发场景。

举报

  • 相关推荐
  • AI日报Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源图像编辑模型Step1X-Edit;​夸克AI超级框上线 “拍照问夸克”

    本期AI日报聚焦多项AI技术突破与应用:1)Moonshot AI推出开源音频模型Kimi-Audio,基于13亿小时训练数据,支持语音识别等任务;2)阶跃星辰开源图像编辑模型Step1X-Edit,展现强大生成能力;3)夸克AI上线"拍照问夸克"功能,实现视觉问答;4)苹果iOS18.5将在中国推送,带来智能功能;5)谷歌发布601个生成式AI应用案例,覆盖多行业;6)微软推出深度整合Windows的UFO²自动化系统;7)OpenAI升级ChatGPT至GPT-4o版本,提升STEM领域能力;8)Ema公司推出高性价比语言模型EmaFusion;9)Liquid AI发布面向边缘设备的Hyena Edge模型;10)LemonAI推出实时音视频数字人产品Slice Live。此外,国内方面,智谱与生数科技达成战略合作推动大模型发展,宝马中国宣布新车将接入DeepSeek技术。

  • AI日报:国内首个多模态AI程序员上岗;字节启动Top Seed计划招募AI人才;DeepSeek R1T Chimera上线OpenRouter

    【AI日报】今日AI领域重要动态:1.百度发布文心快码3.5及多模态AI程序员"文心快码Comate Zulu",提升开发效率;2.字节跳动启动"Top Seed"计划,招募30名AI博士人才;3.DeepSeek开源R1T Chimera模型上线OpenRouter平台;4.阿里AI工程师余亮获"全国劳动模范"称号;5.开源图像编辑工具Step1X-Edit登陆Hugging Face,性能媲美GPT-4o;6.谷歌被曝每月向三星支付巨额资金预装Gemini应用

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • 模型公司纷纷卷向社区,kimi们能否扭转乾坤?

    内容社区能不能打破AI困境?大模型赛道卷上天 ,部分公司开始换新玩法了。据蓝鲸财经报道,月之暗面Kimi正灰度测试一个内容社区产品。从该媒体爆料来看,该社区内大部分内容由AI抓取新闻热点生成,重点关注科技、财经等垂类新闻。有趣的是,据财联社报道,另一个大模型巨头OpenAI也表示将做社交软件,对标的是X,但对于这个社区的定位还没清晰,不知道将来是单独开发

  • AI日报:小米首个推理大模型开源Xiaomi MiMo;快手上线AI笔记工具“喵记多”;腾讯拆分AI团队

    本文汇总了AI领域最新动态:1)小米开源70亿参数大模型Xiaomi MiMo,在数学推理和代码竞赛中超越OpenAI和阿里模型;2)快手推出AI笔记工具"喵记多",简化笔记管理;3)Luma AI发布电影级镜头控制API,降低视频生成门槛;4)腾讯重组AI团队,加大语言模型研发投入;5)Anthropic为Claude引入新语音"Glassy";6)谷歌NotebookLM新增50+语言音频概述功能;7)xAI将发布Grok3.5模型;8)Meta推出独立AI助手应用挑战ChatGPT;9)OpenAI紧急修复GPT-4o"谄媚"问题;10)Mac本地AI助手Simular升级隐私保护;11)CameraBench项目帮助AI理解镜头运动;12)谷歌推出个性化语言学习AI工具。

  • DeepSeek + Kimi一键生成高质量PPT

    文章介绍如何用两个免费AI工具快速制作PPT:先用微信版DeepSeek生成大纲,再用Kimi智能助手一键生成PPT。操作步骤包括:1)在微信搜索DeepSeek,输入需求生成结构化大纲;2)访问Kimi网页版,将大纲粘贴至PPT助手功能;3)选择模板样式,一键生成PPT。该方法适用于教师备课、学生汇报、职场报告等多种场景,能自动完成从构思到排版的全部流程,高效且效果惊艳。

  • 初中老师如何用deepseek 和 Kimi无痛做课件

    本教程指导初中教师如何利用Deepseek和Kimi两款AI工具高效完成备课全流程。Deepseek用于生成教学设计方案和PPT大纲,Kimi则根据大纲快速生成精美课件。操作步骤:1)在Deepseek输入教学需求生成教学设计;2)用Deepseek生成PPT大纲;3)将大纲粘贴至Kimi PPT助手一键生成课件。该方法特别适合日常备课、临时调课需求,能大幅提升备课效率,让教师既省时又高效。

  • AI日报:通义千问Qwen3重磅发布;抖音AI搜索能力开放;ChatGPT 搜索新增网购功能;Suno V4.5版本将发布

    本期AI日报重点内容: 1. 通义千问发布Qwen3大模型,在代码、数学和通用能力方面表现突出,支持两种思考模式并开源多个模型权重 2. 抖音开放AI搜索能力接口,为第三方应用提供丰富内容资源 3. ChatGPT新增网购功能,通过对话获取个性化商品推荐 4. Suno AI即将推出V4.5版本,提升音乐生成真实度 5. Simular AI登陆macOS,打造本地化智能助手 6. 暗月之面开源Kimi-VL模型,可处理文本、图像和视频 7. UCLA与Meta推出d1框架,提升大语言模型推理速度 8. 通义灵码上线Qwen3编程智能体 9. Gen-4References图像生成技术惊艳亮相 10. Hugging Face推出可编程机械臂SO-101 11. Windsurf推出全新品牌标志 12. Ollama全面支持Qwen3模型本地部署

  • 秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一

    Kimi-Audio是一款开源的通用音频基础模型,在语音识别、音频理解、音频转文本、语音对话等任务中表现优异。该模型采用集成式架构设计,包含音频分词器、音频大模型和音频去分词器三大核心组件,支持多模态输入处理。在十余项音频基准测试中,Kimi-Audio均取得领先性能,如LibriSpeech ASR测试WER仅1.28%,VocalSound测试达94.85%。模型使用1300万小时多语言音频数据进行预训练,并构建了自动处理流水线生成高质量训练数据。评估结果显示,Kimi-Audio在语音识别、音乐理解、语音情感分析等任务上全面超越同类模型,在OpenAudioBench和VoiceBench对话测试中也表现最佳。目前模型代码、检查点和评估工具包已在GitHub开源。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。