首页 > 业界 > 关键词  > Designer最新资讯  > 正文

AI日报:微软推设计神器Microsoft Designer;苹果开源小模型 DCLM-Baseline-7B;小爱宣布新增AI文档问答等功能

2024-07-22 14:54 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、微软推设计神器Microsoft Designer

作为一款集成人工智能技术的设计应用程序,Microsoft Designer让设计变得更简单、高效。用户可以在任何设备上访问这个强大的工具,无缝集成于Microsoft365应用,提供智能对象检测、创新工具和图像风格重塑等功能。

【AiBase提要:】

🚀 无缝集成于Microsoft365应用,便捷创建和编辑图像和设计。

🔍 智能对象检测功能,轻松擦除不需要的对象或创建背景虚化效果。

🎨 创新工具包括提示模板、个性化贺卡和邀请函的创建,以及图像风格重塑和背景替换功能。

详情链接:https://top.aibase.com/tool/microsoft-designer-sticker-creator

2、ElevenLabs发布Turbo2.5模型:速度提升3倍,覆盖中文等32种语言

在人工智能的世界里,ElevenLabs推出的Turbo2.5模型再次突破语言界限。该模型不仅在性能和多语言支持方面表现卓越,速度提升3倍,延迟降低至300毫秒,为动态互动提供更强大支持。用户体验方面,提供了丰富的语言选择和便捷的转换功能,同时确保数据安全和合规性。

【AiBase提要:】

🚀 Turbo2.5模型支持32种语言,速度提升3倍,延迟降低至300毫秒,为动态互动提供更强大支持。

🌐 首次支持越南语、匈牙利语和挪威语的文本到语音转换,丰富了语言库,提高了英语文本到语音的速度。

🔊 提供广泛的应用场景,包括会话式AI、教育、娱乐和内容创作,提供逼真的语音支持,如Praktika.ai、Kindroid和Aug X Labs的应用实例。

详情链接:https://elevenlabs.io/api

3、苹果AI发布7亿参数开源语言模型DCLM

苹果公司与多家机构合作推出了7亿参数的开源语言模型DCLM,该模型在训练过程中使用了庞大的数据令牌,帮助理解和生成语言。DCLM提供了标准化的数据集优化工具,帮助研究人员进行有效实验。新模型在重要测试中取得了显著进展,同时降低了计算资源的需求。

【AiBase提要:】

🔑 苹果AI与多家机构合作推出DCLM,创造了一个强大的开源语言模型。

🔑 DCLM提供标准化的数据集优化工具,帮助研究人员进行有效实验。

🔑 新模型在重要测试中取得了显著进展,同时降低了计算资源的需求。

详情链接:https://huggingface.co/collections/mlfoundations/dclm-669938432ef5162d0d0bc14b

4、小米大模型小爱新增AI文档问答、AI图片编辑功能

小米公司宣布小爱同学新增了「AI 图片编辑」功能,用户可进行背景转换、风格转换、路人消除、智能扩图和图片问答等操作。同时,「大模型小爱」还新增了「AI文档问答」功能,提供更智能的文档处理体验。用户需更新至V6.126版本体验新功能。

image.png

【AiBase提要:】

✨ 小爱同学新增「AI 图片编辑」功能,包括背景转换、风格转换、路人消除、智能扩图和图片问答。

🔍 用户需更新至V6.126版本才能使用新功能。

📄 「大模型小爱」新增「AI文档问答」功能,提供更智能的文档处理体验。

5、美图AI视频修复新技术,速度提升 10 倍,过曝也能搞定

视频制作和图像处理领域的关键技术之一是视频的“去闪”技术。BlazeBVD作为一种新型去闪算法,不仅能快速去除视频中的闪烁现象,还保持视频内容完整性和色彩真实性。它的出现革命性改变了视频后期制作的方式。

image.png

【AiBase提要:】

🔍 BlazeBVD是一种自动化的视频去闪技术,能有效提升视频的时间一致性。

⚙️ BlazeBVD利用尺度-时间均衡方法处理视频帧的直方图,捕捉闪烁和局部曝光变化。

🚀 BlazeBVD在全局和局部去闪模块、自适应时间一致性等方面展现卓越效果,速度提升达现有技术的10倍。

详情链接:https://arxiv.org/html/2403.06243v1

6、百度沈抖:大模型应用进入爆发期

在2024中国联通合作伙伴大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖发表了关于深度拥抱人工智能+,加快发展新质生产力的演讲。沈抖强调人工智能是创新的关键技术,大模型是人工智能的前沿阵地,并展示了大模型调用量的指数级增长。百度通过与企业合作,发现底层算力管理平台的重要性,自主研发了百舸算力平台,支持大模型的快速迭代。

【AiBase提要:】

🚀 大模型应用进入爆发期,企业将大模型应用于业务各个环节,而非仅等待爆款应用。

💡 一云多芯成为中国企业必然选择,百度智能云开放百舸算力平台,共享“芯片选择”的自由。

💻 百度基于文心大模型开发千帆工具链平台,降低大模型的技术门槛和使用成本,推出千帆·行业增强版加速企业创新。

7、微软研究人员SpreadsheetLLM项目

微软研究人员最近发布了名为SpreadsheetLLM的创新研究,旨在解决大语言模型在解析电子表格时遇到的难题。该项目通过一种编码框架,使得大语言模型能够“读懂”电子表格的内容,有望显著提升电子表格的数据管理和分析效率,同时使用户能够用自然语言向AI提出问题,无需掌握复杂的公式和操作。

image.png

【AiBase提要:】

📊 电子表格对大语言模型的挑战: 电子表格结构复杂且二维布局,超出了大语言模型通常处理的线性输入范围。

🔍 SpreadsheetLLM技术解析: 微软提出了SheetCompressor和Chain of Spreadsheet两大核心技术,大幅提升了大语言模型对电子表格的理解能力。

🛠️ 对微软AI工具的影响: SpreadsheetLLM有望增强微软C opilot在Excel中的应用能力,但目前仍面临生成数据准确性和计算资源消耗。

详情链接:https://arxiv.org/html/2407.09025v1

8、谷歌2024年硬件大秀:Pixel9、Gemini以及新款可折叠手机

谷歌将提前举行大型硬件活动,宣布Pixel9等新品,领先于苹果iPhone16发布。Gemini话题备受关注,新设备将引领Android领域AI功能。Android15带来新功能和UI调整,Google Assistant的未来仍有悬念。Pixel Watch3和Pixel Buds Pro2也将亮相。

【AiBase提要:】

📱 谷歌将提前发布Pixel9,领先苹果iPhone16。

🌟 新设备将引领Android领域AI功能,Gemini话题备受关注。

🔍 Android15带来新功能和UI调整,Google Assistant的未来仍有悬念。

9、Arcee AI发布开源语言模型Arcee-Nova:基于Qwen2-72B 性能接近 GPT-4

Arcee AI最新推出的开源语言模型Arcee-Nova表现优异,接近GPT-4水准,标志着重要里程碑,为AI社区带来新希望。Arcee-Nova结合Qwen2-72B-Instruct和定制调优模型,功能全面,广泛应用于客户服务、内容创作、软件开发和教育等多个领域。

image.png

【AiBase提要:】

🌟 Arcee-Nova表现优异,接近GPT-4水准,为AI社区带来新希望。

💡 Arcee-Nova结合Qwen2-72B-Instruct和定制调优模型,功能全面。

📈 Arcee-Nova广泛应用于客户服务、内容创作、软件开发和教育等多个领域。

详情链接:https://udify.app/chat/s3i0GX51Rwrb4XRm

10、日本超市引入AI微笑监测系统

日本连锁超市AEON引入了名为“Mr Smile”的AI微笑监测系统,旨在提高员工的服务质量和顾客体验。虽然系统在提升服务态度方面取得了显著效果,但也引发了争议和担忧,涉及员工微笑的自然性和顾客骚扰问题。与其他行业做法相比,如麦当劳的“0元笑容”理念和福冈超市的慢速结账通道,AEON的举措受到了不同看法。

image.png

【AiBase提要:】

📈 AI微笑监测系统: AEON的“Mr Smile”系统通过分析450多种因素评估员工微笑和服务态度,旨在提升顾客体验。

🔍 争议与担忧: 技术引发对员工骚扰的担忧,部分人认为强制微笑可能加剧员工苛责。

💡 行业对比: AEON与麦当劳的“0元笑容”理念相似,但面临员工负担增加批评。福冈超市的慢速结账通道得到积极评价。

11、格灵深瞳开源视觉语言表示学习模型RWKV-CLIP

格灵深瞳开源了RWKV-CLIP模型,这是一个结合了Transformer和RNN优点的视觉语言表征学习器。该模型通过图文预训练任务,使用从网站获取的图像-文本对扩展数据集,显著提高了视觉和语言任务的性能。研究团队引入了多样化的描述生成框架,利用大型语言模型从基于网络的文本、合成字幕和检测标签中合成和细化内容,以解决噪声数据问题并提高数据质量。

【AiBase提要:】

🔍 模型结合了Transformer和RNN优点,通过图文预训练任务显著提高了视觉和语言任务性能。

🔬 引入多样化的描述生成框架,利用大型语言模型合成和细化内容,解决噪声数据问题并提高数据质量。

🚀 RWKV-CLIP模型在输入增强方面表现出色,实现了显著的性能提升,并在多个下游任务中取得最先进的性能。

详情链接:https://wisemodel.cn/models/deepglint/RWKV-CLIP

12、Neo4j LLM 知识图谱AI生成器:将非结构化数据转换为知识图谱

将杂乱无章的数据转化为有用的信息变得越来越重要,Neo4j推出了全新工具Neo4j LLM知识图谱构建器,利用强大的机器学习模型将非结构化数据转化为结构化的知识图谱,提高数据处理效率。工具灵活性高,用户可自定义提取模式和清理数据,提供多种数据查询技术,使数据分析更高效智能。

image.png

【AiBase提要:】

📊 强大的机器学习模型:基于OpenAI、Gemini等模型,处理各种数据格式,生成全面的知识图谱。

⚙️ 灵活的数据提取:用户可自定义节点和关系提取模式,进行数据清理,提高数据准确性和实用性。

🚀 高效的数据查询:提供GraphRAG、Vector和Text2Cypher等多种技术,帮助用户进行智能的数据分析和查询。

详情链接:https://top.aibase.com/tool/llm-graph-builder

13、OpenAI CEO承认“GPT-4O MINI”字母数字组合的命名方式存在问题

在OpenAI推出新一代GPT大语言模型GPT-4o Mini后,CEO山姆·奥特曼承认产品命名存在问题,引发广泛关注和批评。他表示需要重新考虑命名方案,展现了对命名问题的重视。尽管面临挑战,OpenAI在其他项目中展现出创意的命名方式。未来是否会对现有命名体系进行全面改名,仍是未知数。

【AiBase提要:】

📢 山姆·奥特曼承认OpenAI的字母和数字组合命名方式需要改进。

🔍 OpenAI近期发布的GPT-4o Mini被批命名繁琐,引发CEO回应。

💡 OpenAI的其他项目如Sora和DALL-E有更具创意的命名方式。

14、StockBot:AI驱动的实时股票数据聊天机器人,让投资更智能

在信息爆炸的时代,投资者需要快速、准确的股票数据和新闻。StockBot是由Lama3-70B驱动的聊天机器人,运行在Groq上,能以闪电般的速度处理数据,通过Vercel生成式UI展示用户友好的界面。它支持股票、外 汇、债券和加密货币,提供全面的市场分析,为投资者提供强大的助手。

image.png

【AiBase提要:】

🤖 实时AI聊天: StockBot通过Llama370b支持的AI实现自然语言交互,提供即时股票信息和图表。

📈 交互式股票图表: 使用TradingView的实时小部件展示个性化、可定制的股票图表和数据分析。

🚀 动态界面渲染: 根据用户查询动态渲染TradingView UI组件,提供最适合的金融界面。

详情链接:https://github.com/bklieger-groq/stockbot-on-groq

举报

  • 相关推荐
  • 率先支持 AMD EXPO™ ULL | Origin Code部分Vortex DDR5内存套装正式兼容新一代超频规范

    Origin Code宣布旗下部分Vortex DDR5内存套装已正式支持AMD最新EXPO™ ULL规范,成为业内首批支持该技术的品牌之一。该规范优化了DDR5内存超频配置,在兼容性、训练机制及高频扩展能力上全面提升。目前已有48GB(6000CL26/6200CL28)及96GB(6000CL26)等多款配置完成优化适配。此外,Origin Code将在COMPUTEX 2026现场展示基于新规范的高频DDR5配置,并首次公开与Futuremach联合打造的全新开放式机箱。

  • Origin Code 携手技嘉与Intel,于 COMPUTEX 2026 发布全新 4R CUDIMM 内存

    Origin Code今日宣布推出4R CUDIMM DDR5内存方案,由技嘉联合打造,针对Intel Core Ultra平台优化。该方案采用四Rank架构与CKD设计,突破传统双Rank容量限制,单条可达128GB,在1.4V电压下实现DDR5-8000MT/s、CL42低延迟,将工作站级容量带入高端桌面,满足AI训练、8K视频剪辑等高负载需求,并将在COMPUTEX 2026展示。

  • vivo X Fold6官宣6月发布:首发OriginOS 6 Fold系统

    vivo今天正式宣布,新一代折叠屏vivo X Fold6将在本月发布,并且首发OriginOS 6 Fold系统。 vivo高管黄韬发文称,vivo认为过去几年折叠手机的第一次进化,本质上是展开一块大屏幕,而Agent Phone则带来了明确的启示折叠手机的第二次进化,是从展开一块大屏幕,到展开一个大任务。 黄韬表示,当下折叠屏在轻薄度、折痕、续航、影像、可靠性等硬件层面持续优化,但行业普遍存在�

  • 视觉中国科技行业垂类AIGC素材 解锁视觉新图景

    视觉中国携手1.2万+签约AI创作者,汇集超900万优质AIGC图片、视频素材,覆盖医疗生物、航天航空、智能制造、互联网数字科技、新能源环保五大科技领域。通过AI镜头,将科创蓝图具象化,提供从写实摄影到创意构想的多样化素材,适配品牌海报、科普视频、科研配图等场景,持续更新正版AIGC素材,助力用户“看见”未来。

  • 收费才是DeepSeek的“成人礼”

    DeepSeek首次融资的“金主”名单,逐渐浮出水面。 6月3日,媒体报道称,DeepSeek计划募集约500亿元人民币,投后估值达3500亿至4000亿元。相比上月底传闻的700亿元,最新传出的融资规模略有收缩。 除了DeepSeek创始人梁文锋承诺投入200亿元外,腾讯考虑投资100亿元,宁德时代也可能投资50亿元。综合多方消息,其他潜在投资方包括国家集成电路产业投资基金、网易、京东、砺思资�

  • 铭瑄 B850 AIGA,中端价格享旗舰级体验

    铭瑄MS-iCraft B850AIGA主板以中端价格提供接近X870级别的旗舰配置,解决了用户面对低价主板缩水、高端主板过高的两难选择。它采用16+2+1相80A Dr.Mos数字供电,稳定支持高达400W处理器功耗,轻松驾驭锐龙99900X等顶级型号。配备4个M.2接口(其中2个支持PCIe5.0)和2条PCIe5.0x16插槽,扩展性超越同价位产品。网络方面搭载5G有线网卡+Wi-Fi7+蓝牙5.4组合,通常仅见于千元以上高端主板。此外,它还拥有高颜值二次元设计、RGB散热装甲、易用的PTM UI BIOS和E-touch人性化设计,如显卡瞬拆、天线快装等。这款主板不做参数妥协,不砍核心配置,以旗舰规格降低高端体验门槛,是预算有限但追求性能、颜值、扩展性和长期使用的高性价比首选。

  • 纽约大学阿布扎比分校成功研发实时手语翻译系统ChatSign

    纽约大学阿布扎比分校推出ChatSign商业化AI系统,可实时将口语翻译成手语,帮助全球数百万听障人士实现顺畅沟通。该系统由教授Yi Fang领衔研发,已支持阿拉伯语和英语翻译为美式手语和阿联酋手语,并计划扩展双向翻译功能。自2024年创立以来,ChatSign快速从科研概念发展为功能性原型,已获专利保护,并在多项国家级活动中亮相。未来10年内,团队计划将设备推广至全球,推动无障碍沟通和社会共融。

  • 稳住基本盘的小米,紧追DeepSeek

    ​小米一季度财报发布后第二天,MiMo先有了新动作。 就在刚刚,小米宣布MiMo-V2.5系列API永久降价,最高降幅99%,Token Plan同价位用量提升至5至8倍。几天前,DeepSeek刚把V4-Pro的2.5折优惠改成永久价。小米这次跟进,意味着MiMo正在以更低门槛加速参与大模型竞争。 “从短期来看,我们面对成本周期、需求周期和竞争周期三重周期叠加的挑战;长期来看,我们正进入AI重构人车家全

  • 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计

    腾讯云在2026 AI产业应用大会上发布CodeBuddy+ Security,结合自研AI深度审计引擎与静态分析工具Xcheck,解决AI时代漏洞激增及传统代码审计瓶颈。该产品采用“双引擎协同+工程化约束”策略,通过AI引擎专攻深层逻辑漏洞,Xcheck处理已知特征漏洞,并引入独立二次校验和PoC验证,确保漏洞真实可修复。目前已在NVIDIA、Google等主流项目中发现并协助修复多个有效漏洞,并逐步接入腾讯内部发布流水线,面向企业开放试用。

  • 活动回顾|从流量竞争到精细化运营,Sigmob解读游戏增长新机会

    5月26日,Sigmob联合罗斯基、Google等伙伴在杭州举办“游戏赛道新机会”沙龙,聚焦IAA、混合变现、AI与游戏增长等热点。活动指出,游戏商业化已进入精细化运营阶段,需关注ROI与用户长期价值。Sigmob分享了从广告收益到用户体验的变现方法论,强调通过用户分层、动态竞价等策略构建稳定收益模型。同时,AI与数据能力正驱动商业化效率提升,Sigmob通过智能瀑布流、实时策略优化等技术,助力开发者实现流量价值最大化,并持续探索游戏增长新机会。

今日大家都在搜的词: