首页 > 业界 > 关键词  > AnyText最新资讯  > 正文

AI视野:阿里开源AnyText;Pika推出付费计划;阿里推文生3D数字人项目;Magnific AI图片分辨率扩大至10K*10K

2024-01-08 15:55 · 稿源:站长之家

欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

🤖📈💻💡大模型动态

阿里开源AnyText

阿里开源多语言视觉文字生成与编辑模型——AnyText,AnyText对生成文字的把控可媲美专业PS,用户可自定义规划文字出现的位置,图片的强度、力度、种子数等,目前在Github超2,400颗星非常受欢迎。

【AiBase提要】

🔸阿里巴巴开源的AnyText可以在图像中生成精准的文本,支持中文。

🔸AnyText采用文本控制的扩散流程,包括辅助潜变量模块和文本嵌入模块,能够生成弯曲、不规则的字体。

🔸AnyText使用了多个OCR识别数据集和严格的过滤规则构建了AnyWord-3M数据集,提供高质量的训练数据。

模型地址:https://top.aibase.com/tool/anytext-tuwenronghe

开源地址:https://github.com/tyxsspa/AnyText

英伟达推新AI语音识别模型Parakeet

NVIDIA NeMo宣布推出Parakeet ASR模型系列,这是一系列先进的自动语音识别(ASR)模型,与Suno.ai合作开发。

【AiBase提要:】

🗣️ Parakeet ASR模型系列: NVIDIA NeMo推出Parakeet ASR模型系列,与Suno.ai合作开发,优于OpenAI的Whisper v3,具有鲁棒性和出色的准确性。

🚀 四个模型: Parakeet包括RNNT1.1B、CTC1.1B、RNNT0.6B和CTC0.6B,基于RNN Transducer / Connectionist Temporal Classification解码器,参数范围0.6-1.1亿。

🌐 灵活、易用、可扩展: Parakeet基于NVIDIA NeMo工具包构建,提供灵活性和易用性,适用于各种语音应用场景。具有先进的准确性和鲁棒性。

🤖📱💼AI应用

视频生成工具Pika推出付费计划,提供不同档次选择

Pika宣布推出付费计划,分为两个档次,分别为10美元和60美元。免费版本有水印,300积分生成60个视频,而付费版本消除水印,10美元版本可生成210个视频,60美元版本提供500个视频生成数量和额外功能。用户可根据需求选择不同档次,享受Pika提供的优质服务。

【AiBase提要:】

🚀 Pika付费计划: 视频生成工具Pika推出付费计划,分为10美元和60美元两个档次,提供不同的视频生成数量和额外功能。

🆓 免费版本: Pika免费版本有水印,300积分可以生成60个视频,仍提供基本功能和一定数量的生成次数。

💳 付费档次:10美元版本消除水印,可生成210个视频;60美元版本提供500个视频生成数量和额外功能,折扣积分永不过期,用户可随时使用。

官网地址:https://top.aibase.com/tool/pika

Magnific AI本周更新!可将图片放大至10K*10K分辨率

AI创始人Javi Lopez在推特宣布,Magnific AI将于本周更新,可将图片放大至10K*10K分辨率。

【AiBase提要:】

⭐ 该工具能够"幻想"并重构用户希望的任意细节,使图像变得更加高清和细腻。

⭐ 用户可以通过调整"创造力"滑块来控制AI生成的新细节的数量和类型,从而实现更多创意和个性化的图像增强。

⭐ Magnific AI适用于多种类型的图像,包括人像、插图、视频游戏资产、风景、科幻、奇幻、电影、平面设计、建筑、室内设计和食物照片。

官网地址:https://top.aibase.com/tool/magnific-ai

强大人工智能编码助手code AI

code AI是一款强大的人工智能编码助手,结合了机器学习技术和编程知识,自动分析代码结构并提供智能建议,支持多种编程语言和环境。

image.png

【AiBase提要:】

⭐ 自动分析代码结构并提供智能建议

⭐ 支持多种编程语言和环境

⭐ 智能代码补全和自动重构功能

项目地址:https://top.aibase.com/tool/ant-codeai

ComfyUI工作流管理插件Comfyspace更新

Comfyspace是一款实用的工作流管理插件,最新更新功能更强大,基本解决了工作流管理和使用的问题。

【AiBase提要:】

📷工作流管理插件更新功能:Comfyspace添加设置封面照片、手动保存和查看历史版本、引入了文件夹和标签。

🔗新增功能:云同步和备份工作区,一键安装模型。

🚀更新工作流管理插件:Comfyspace增强了工作流功能,使用户更方便地管理和使用。

项目地址:https://top.aibase.com/tool/comfyspace

AI通话服务Bland 半秒响应,可同时进行50万个通话

Bland是一个AI通话服务,它支持半秒响应。它能够稳定地匹配人类的速度和质量,为用户带来最快的沟通体验。

【AiBase提要:】

⭐️ Bland是一个AI通话服务,支持半秒响应,能稳定匹配人类的速度和质量。

⭐️ 用户可以免费试用,体验快速响应的便利,同时保持高质量的对话。

⭐️ Bland支持自定义通话主题和声音,用户可以根据需求和偏好定制通话内容。

体验地址:https://top.aibase.com/tool/bland-turbo

📰🤖📢AI新鲜事

阿里推文生3D数字人项目Make-A-Character

阿里通义实验室XR实验室推出Make-A-Character项目,能从文字快速生成3D数字人。

image.png

【AiBase提要:】

💡用户可自定义面部特征,比如脸型、眼睛颜色等。

💡角色基于真实人类扫描数据集生成,发型为实际发丝而非网格。

💡MACH通过文本描述生成逼真的、完整的、可动画化的3D角色,适用于各种娱乐和专业场景。

项目及演示:https://top.aibase.com/tool/make-a-character

雷军称小米汽车全身都是先进AI科技

雷军在微博上表示,小米汽车几乎全身都是先进AI科技,V8s也已实现量产,预计2025年上车。

【AiBase提要:】

⭐️ 小米汽车全身几乎都是先进AI科技,包括材料仿真、电机设计和智能驾驶。

⭐️ 小米汽车运用多元材料AI仿真系统打造强大材料支撑的泰坦合金。

⭐️ 小米汽车的目标是在未来15到20年内成为全球前五的汽车制造商。

初创公司Nation A发布Neuroid,革新生成式人工智能技术用于3D动画制作

Nation A公司推出Neuroid,一项生成式人工智能技术,可根据文本提示生成人形角色和四条腿的动物的3D动画,显著缩短动画制作时间。

image.png

【AiBase提要:】

🤖 Neuroid发布: Nation A初创公司发布Neuroid,一项生成式人工智能技术,用于根据文本提示生成人形角色和四条腿的动物的3D动画,缩短制作时间。

🚀 创新技术: Neuroid通过自主生成逼真动作,超越传统技术,支持角色绑定过程,与流行的3D软件包兼容,为创作者提供更大灵活性。

💡 AI Human Studio: 公司还推出“AI Human Studio”捕捉面部特征和人类表情,提供经济高效替代传统方法,旨在通过SaaS服务使高质量的3D动画广泛可用。

项目体验网址:https://top.aibase.com/tool/neuroid

👨‍💻💡🎯聚焦开发者

四行代码让大模型上下文暴增3倍,羊驼Mistral都适用

近日,来自得克萨斯农工大学等机构的华人学者们发布了全新的大模型窗口扩展方法SelfExtended(简称SE)。无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍!

【AiBase提要:】

💡 新方法SelfExtended可即插即用,提升大模型上下文长度。

💡 SelfExtended已在Mistral和Llama2上试验成功,未处理的模型在6k长度时开始出现问题。

💡 SelfExtended在专为长文本模型设计的LongBench数据集中取得了良好的评分。

论文地址:https://arxiv.org/abs/2401.01325

Colossal-AI团队开源了SwiftInfer

Colossal-AI团队开源了SwiftInfer,实现了无限流式输入推理,成功提升了大模型推理性能46%,为多轮对话场景提供高效可靠的落地方案。

【AiBase提要:】

⭐️SwiftInfer成功提升大模型推理性能46%。

💡解释了StreamingLLM的attention sink注意力机制、窗口注意力优化、KV Cache机制优化方法及优势。

🔗成功将StreamingLLM方法与TensorRT推理优化结合,提高46%推理吞吐速度。

项目地址:https://top.aibase.com/tool/swiftinfer

举报

  • 相关推荐
  • ​AI 测试引领者——Testin 云测荣膺“2025 数字中国 TOP100”

    近日,中国科学院主管的《互联网周刊》发布“2025数字中国TOP100”榜单,Testin云测与华为、大疆、阿里巴巴等企业共同入选。该榜单覆盖人工智能、智能制造、区块链等多个数字技术领域,旨在为各行业数字化转型提供技术参照。Testin云测作为AI测试服务商,凭借深厚技术积累,助力金融、汽车等行业突破质量瓶颈,提升测试效率3倍以上,成为支撑产业数字化的关键力量。

  • 华为新一代三折叠旗舰MateXTs将于9月4日发布

    就在刚刚,华为正式宣布,将于9月4日14:30发布其新一代三折叠旗舰手机——华为Mate XTs非凡大师。华为常务董事余承东在社交媒体上激动表示:“新三折叠来了!9月4日,我们不见不散。” 此前,供应链消息透露,华为首款三折叠产品Mate XT市场反响热烈,截至今年上半年出货量已逼近50万台大关。此次即将发布的Mate XTs,在外观设计上延续了Mate XT的经典风格,同时提供了玄黑、�

  • Matrixport 旗下 Cactus Custody 与 OnChain 合作,完成招银国际美元货币市场基金化上链

    新加坡Matrixport旗下合规数字资产托管商Cactus Custody与OnChain合作,将招商国际美元货币市场基金以化形式上链运营,成为全球首只港新互认基金上链案例。该合作解决市场缺乏可审计、可托管的现金类资产等痛点,通过链上净值计算、白名单管理等机制,为机构与合格投资者提供透明、合规的链上投资选项。未来双方将持续深化合作,推动RWA标准化发展。

  • Lamett乐迈石晶快装秘籍!让武汉20年老宅“一键焕新”

    武汉黄先生一家140平米老宅经《梦想改造家》节目改造后焕然一新。设计师采用零甲醛添加的Lamett乐迈石晶地板,解决潮湿问题,提升防滑耐磨性能。空间重构实现客卧对调、主卧休闲办公一体化,厨房岛台增进家人互动。全屋原木色调营造温馨氛围,兼顾健康与美学,为五口之家打造安全舒适的生活环境。

  • 中国UP主成为不了MrBeast

    影视飓风创始人Tim刚刚结束的“100小时荒岛直播挑战”,无疑是一次B站在这个夏天难得的现象级事件——B站累计超过四千万观众进入直播间,全平台总观看量超过两亿,弹幕数以百万计,甚至带动了直播带货的即时转化。 从数据到热搜,此次直播堪称完美演绎了“爆款”的逻辑。 质疑声同样随之而来:这场直播与其说是“荒岛生存”,不如说是“带电度假”;也评论认为,它

  • 欧税通成为TikTok Shop官方认证全品类合规TSP服务商!

    欧税通凭借出色的出海合规服务能力,正式通过TikTok Shop官方审核,成为其推荐的TSP服务商。此次认证覆盖税务合规、EPR合规、检测认证、授权代表、知识产权服务等全品类合规服务。作为跨境合规SaaS平台,欧税通以全品类覆盖和技术驱动的双轮优势,连续三年稳居中国跨境合规行业市占率第一。未来将与TikTok Shop在产品迭代、技术协同等方面展开深度合作,助力中国品牌合规出海。

  • 一款专为日常需求设计的超值平板:三星Galaxy Tab S10 Lite正式发布

    三星电子于2025年8月25日发布Galaxy Tab S10 Lite平板电脑,配备10.9英寸大屏、S Pen手写笔及多项智能功能,支持高效学习、创作与娱乐。搭载升级处理器、8000mAh电池和快充技术,确保长续航。提供星空灰、星川银、星语红三款配色,9月5日起陆续上市。

  • 罗永浩官宣明日将公布TBT项目 号称九年磨一面

    今日,罗永浩在微博上发布重磅消息,宣称“TBT终于要上了!”他感慨道,九年来赛道虽变,但自己一直特别想给新赛道带来不一样的创新,还表示要“重构你对泡面的想象,明天见”,引发网友广泛关注与猜测。

  • 中国冰箱业TOP5型号4款是海尔

    2025年7月冰箱行业零售额、零售量增速放缓,环比下降34.5%和29.1%。行业承压加剧,多数品牌负增长,仅海尔冰箱逆势增长9.1%。海尔凭借爆款产品带动增长,TOP5型号中占4款,均为主打高端十字门冰箱。其磁控全空间保鲜技术获国家科技奖,显著延长食材保鲜期。通过全流程数字化升级,海尔实现运营效率提升,以科技驱动和用户体验赢得市场,为行业提供增长启示。

  • 智谱AI发布AutoGLM 2.0 - 首个为手机而生的通用Agent。

    智谱今天,终于发了AutoGLM2.0。 想一想,AutoGLM1.0的版本,距离我第一次首发写他们,已经过去快10个月了。 那个时候,他们掀起了一波Agent热潮,甚至连A股都出现了智谱概念股,他们也开启了Agent的另一条支线,用视觉的方式来操控原有设备。 当时,我对着我的手机说:我29号要去一趟深圳,你帮我定个罗湖地铁站附近的酒店,预算600元以内,大床房。 然后,我的手机,就像

今日大家都在搜的词:

热文

  • 3 天
  • 7天