《Duck Duck Moose的创业故事:触屏吸引孩子》文章已经归档,不再展示相关内容,编辑建议你查看最新于此相关的内容:MiniCosmo 酷妙星球儿童指甲油获得美国全国育儿产品奖(NAPPA)2021 年 6 月 1 日,MiniCosmo酷妙星球儿童指甲油获得美国“The Nationa| Parenting Publications Aw
(举报)
《Duck Duck Moose的创业故事:触屏吸引孩子》文章已经归档,不再展示相关内容,编辑建议你查看最新于此相关的内容:MiniCosmo 酷妙星球儿童指甲油获得美国全国育儿产品奖(NAPPA)2021 年 6 月 1 日,MiniCosmo酷妙星球儿童指甲油获得美国“The Nationa| Parenting Publications Aw
(举报)
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
作者:邵旭辉,FoothillVentures管理合伙人,在机器学习、大数据系统和软件系统工程领域从事研发和管理工作多年,曾任雅虎广告及大数据平台工程副总裁、TurnCTO及IDAnalytics副总裁。他持有清华大学自动化学士学位及明尼苏达大学EECS博士学位。不过在这个最终将达万亿美元、改变人类生活的市场里,我很期待看到更多来自华人参与者的身影,不管是创业、投资是积极地拥抱生成式AI让生活、工作变得更高效,它将前所未有地改变我们与世界交互的方式。
Alphabet旗下的Google在周二宣布了几项新的生成式人工智能功能,公司表示这项新技术会取代其价值数十亿美元的搜索业务是会增强其功能,提高搜索结果的相关性。Google首执行官SundarPichai表示,目前还不太可能会有任何技术对Google的利润丰厚的现有产品构成胁。Alphabet的股价略有上涨,周二晚上在阿联的交易中,其股价为171.84美元,公司市值达到了2.11万亿美元。
Cohere近期发布了其ToolkitAI工具包,该工具包的初始应用程序是一个专为企业定制的知识助手。这款知识助手能够连接企业数据,为特定团队提供定制化服务,通过快速访问信息和自动化任务来提升工作效率。通过结合先进的AI技术和定制化解决方案,Cohere的知识助手有望成为企业数据管理和团队协作的强大助手。
Google正在加强Android的CircletoSearch功能,这一功能允许用户在Android手机屏幕上划圈搜索,现在又新增了一个功能,可以生成解学校数学和物理问题的指导步骤。学生现在可以使用Android手机或平板电脑上的Circleto功能,在做作业时得到数学问题的人工智能辅助。它是Android的明星新功能之一尽管iOS用户目前无法使用这一功能来帮助解决数学作业,但一切皆有可能。
为进一步推动上海AIGC行业的交流与合作,促进技术创新和应用落地,4月25日,由上海市人工智能行业协会主办的“龙腾启新·AI创未来”上海AIGC行业技术沙龙圆满举行。岩山科技旗下上海岩芯数智受邀参与并发表了《RockAIRAG商业化之路》的主题分享,详解其在AIGC领域的最新研究成果及商业化进程,引起了与会者的广泛关注。相信RockAI将继续发挥自身优势,通过技术创新推动AIGC技术的商业化进程,与各界伙伴携手,为人工智能行业的健康、长远发展注入新的动力。
今年4月,“加盟制奶茶第一股”茶百道在港股上市,人们发现,它的7000多家门店是从成都一家“夫妻店”发展而来。已经交表等待上市的沪上阿姨,发迹于10多年前上海人民广场的一家小门脸,夫妻两人都是联合创始人。从深圳成长起来的奈雪的茶,同样由一对夫妇创办,当年两人谈生意谈成了对象,成为创投圈的一段佳话。这让我们感到好奇,我们身边究竟有多少“夫妻店�
4月11日,备受瞩目的第二十四届国际眼科学学术会议暨2024第十一届国际角膜塑形学术论坛在上海盛大开幕。此次盛会汇聚了全球眼科领域的顶尖专家、学者及业界精英,共同探讨眼科技术的创新与发展动向。”童享将不断深耕近视防控领域,持续性投入产品与技术的研发及拓展,为有“近视管理”需求的青少年提供更好的视觉体验和服务,共同塑造他们的新“视”界。
5月8日,直播电商助农兴农研讨会在云南举行,来自农业农村部信息中心、云南省商务厅、云南省农业农村厅、云南省委网信办、昆明市商务局、云南省青年创业协会的会议代表,北京大学、中国人民大学助农专家及快手等企业代表走进云南,围绕直播电商助农兴农展开深度研讨。2023年快手农产品订单量超13.6亿,同比增长56%。直播电商成为一道独特的助农景观,为投身乡村振兴建设的年轻人提供了一条就业、创业的重要路径,也将农产品上行的道路越拓越宽。
AI编程是生成式AI崛起以来最热门的赛道之一,不仅海内外大厂均有布局已经诞生了数家融资额过亿,估值过10亿美元的头部创业公司。无论对于程序员还是企业客户,AI编程的本质价值是降本增效它带来的效果是直接的,目前已有44%的程序员使用过AI编程软件。未来要解决这个问题,一方面需要升级AI编程模型的基础能力,减少“幻觉”,另一方面也需要在工程方面针对性地打�
“过去这一年,我跟很多创业者、开发者交流,感觉大家都处在一种‘FOMO’状态,既兴奋、又害怕错过。”面对在生成式AI浪潮中正被彻底改变的开发者群体,4月16日对外演讲中,李彦宏率先谈起了他们所遭遇的选择迷茫问题。在文字、图片、语音、视频等多模态大模型的长期竞争中,留给李彦宏的新挑战之一便是,如何带领百度继续保持模型性能的领先优势。
MuLan是一个开源的多语言扩散模型,旨在为超过110种语言提供无需额外训练即可使用的扩散模型支持。该模型通过适配技术,使得原本需要大量训练数据和计算资源的扩散模型能够快速适应新的语言环境,极大地扩展了扩散模型的应用范围和语言多样性。MuLan的主要优点包括对多种语言的支持、优化的内存使用、以及通过技术报告和代码模型的发布,为研究人员和开发者提供了丰富的资源。
MiLM-6B是由小米公司开发的大规模预训练语言模型,参数规模达到64亿,它在中文基础模型评测数据集C-Eval和CMMLU上均取得同尺寸最好的效果。该模型代表了自然语言处理领域的最新进展,具有强大的语言理解和生成能力,可以广泛应用于文本生成、机器翻译、问答系统等多种场景。
TalentGenius是一个利用人工智能技术帮助专业人士评估技能、优化职业路径,并匹配最佳工作机会的平台。它通过AI工具提供个性化的职业导航、辅导、招聘和咨询,帮助用户在技术快速发展的今天保持竞争力。
Pipecat是一个开源框架,用于构建语音和多模态对话代理,如个人教练、会议助手、儿童故事玩具、客户支持机器人、接待流程和机智的社交伴侣。它支持本地运行,并可迁移到云端,集成了多种AI服务和传输方式,具有高度的可定制性和扩展性。
MetaTrend是一个专注于提供AI、加密货币和金融行业趋势的新闻网站。它通过每日更新的新闻摘要,帮助用户快速了解这些领域的最新动态,对于希望紧跟科技和金融潮流的专业人士来说,这是一个不可或缺的工具。
打标助手是基于GPT4-Vision开发的一个在线工具,它通过微调prompt实现批量图片文字标注,为基于SD模型的训练提供数据支持。该工具的主要优点在于其免费性、批量处理能力和高效的标注准确性,特别适合需要大量图片标注的科研和商业用户。
Gemma 2是下一代谷歌Gemma模型,拥有27亿参数,提供与Llama 3 70B相当的性能,但模型大小仅为其一半。它在NVIDIA的GPU上运行优化,或在Vertex AI上的单个TPU主机上高效运行,降低了部署成本,使更广泛的用户能够访问和使用。Gemma 2还提供了强大的调优工具链,支持云解决方案和社区工具,如Google Cloud和Axolotl,以及与Hugging Face和NVIDIA TensorRT-LLM的无缝合作伙伴集成。
Gemini 1.5 Flash是Google DeepMind团队推出的最新AI模型,它通过'蒸馏'过程从更大的1.5 Pro模型中提炼出核心知识和技能,以更小、更高效的模型形式提供服务。该模型在多模态推理、长文本处理、聊天应用、图像和视频字幕生成、长文档和表格数据提取等方面表现出色。它的重要性在于为需要低延迟和低成本服务的应用提供了解决方案,同时保持了高质量的输出。
Imagen 3 是谷歌一个先进的文本到图像的生成模型,它能够生成具有极高细节水平和逼真效果的图像,并且相较于之前的模型,其视觉干扰元素显著减少。该模型对自然语言的理解更为深入,能够更好地把握提示背后的意图,并从更长的提示中提取细节。此外,Imagen 3 在渲染文本方面表现出色,为个性化生日信息、演示文稿标题幻灯片等提供了新的可能性。
Veo是Google最新推出的视频生成模型,能够生成高质量的1080p分辨率视频,支持多种电影和视觉风格。它通过先进的自然语言和视觉语义理解,能够精确捕捉用户创意愿景,生成与提示语调一致且细节丰富的视频内容。Veo模型提供前所未有的创意控制水平,理解电影术语如“延时摄影”或“航拍景观”,创造出连贯一致的画面,使人物、动物和物体在镜头中逼真地移动。
PaliGemma是Google发布的一款先进的视觉语言模型,它结合了图像编码器SigLIP和文本解码器Gemma-2B,能够理解图像和文本,并通过联合训练实现图像和文本的交互理解。该模型专为特定的下游任务设计,如图像描述、视觉问答、分割等,是研究和开发领域的重要工具。
lluminous是一个快速、轻量级的开源聊天界面,支持多供应商API密钥,提供完整的隐私保护,所有对话历史和密钥都存储在本地。它支持多模态输入、多轮对话提示、预填充响应、模型切换以及对话分享等功能。
CuMo是一种多模态大型语言模型(LLMs)的扩展架构,它通过在视觉编码器和MLP连接器中融入稀疏的Top-K门控专家混合(MoE)块,提高了模型的可扩展性,同时在推理时几乎不增加激活参数。CuMo在预训练MLP块后,初始化MoE块中的每个专家,并在视觉指令调整阶段使用辅助损失以确保专家的均衡负载。CuMo在各种VQA和视觉指令遵循基准测试中超越了其他同类模型,且完全基于开源数据集进行训练。
混元-DiT是腾讯推出的首个中英双语DiT架构的人工智能模型,专注于中文元素理解,具备长文本理解能力和细粒度语义理解。该模型能够分析和理解长篇文本中的信息,并生成相应的艺术作品,包括但不限于人物写真、创意创作等。混元-DiT的推出,对于提升中文文本理解的深度和广度,以及促进中英双语交流具有重要意义。
GPT-4o('o'代表'omni')是自然人机交互的重要一步,它可以接受任意组合的文本、音频、图像和视频输入,并生成任意组合的文本、音频和图像输出。它在音频输入响应上的速度极快,平均响应时间仅为320毫秒,与人类对话的响应时间相近。在非英语文本处理上取得了显著进步,同时在API上速度更快且成本降低了50%。GPT-4o在视觉和音频理解方面也比现有模型更出色。
AutoGroq是一个AI驱动的对话助手,旨在通过自动生成专家代理来彻底改变用户与AI工具的互动方式。它克服了现有解决方案的局限性,提供了一个用户友好、强大且无需配置的体验。该平台专注于通过自动生成专门针对任何问题的专家代理,无论问题的复杂性如何,提供即时和相关的帮助。
OpenGlass是一款可穿戴眼镜,它能够记录用户的生活,并提供有帮助的总结和建议。这款眼镜可以针对不同的使用场景进行定制,适合追求个性化体验和生活记录的用户。它结合了最新的硬件技术和软件开发,为用户带来全新的交互体验。
Refuel LLM-2 是一款为数据标注、清洗和丰富而设计的先进语言模型。它在约30种数据标注任务的基准测试中超越了所有现有的最先进语言模型,包括GPT-4-Turbo、Claude-3-Opus和Gemini-1.5-Pro。Refuel LLM-2 旨在提高数据团队的工作效率,减少在数据清洗、规范化、标注等前期工作上的手动劳动,从而更快地实现数据的商业价值。
Aloe是由HPAI开发的一款医疗领域的语言模型,基于Meta Llama 3 8B模型进行优化。它通过模型融合和先进的提示策略,达到了与其规模相匹配的最先进水平。Aloe在伦理和事实性指标上得分较高,这得益于红队和对齐工作的结合。该模型提供了医疗特定的风险评估,以促进这些系统的安全使用和部署。
FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频。FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识别效果最优的开源中文ASR模型之一,并且能够一体化的准确预测时间戳。