- 蚂蚁集团等:GraphRAG技术综述
大语言模型(LLMs)在自然语言处理领域取得显著进展,但存在缺乏领域知识、信息更新不及时和 “幻觉” 等问题。检索增强生成(RAG)通过引入外部知识改进 LLMs 输出,但传统 RAG 在处理文本关系以及全局信息提取方面有一定局限性,难以突出相互之间的影响。为此,本文提出的GraphRAG 则利用图数据库的结构信息,更精准全面地检索,提升回答的准确性和相关性。
任朝阳 · 2025-04-11 14:28 - Snowflake 加强对 Apache Iceberg 表的支持
Snowflake 今天推出了一系列针对 Apache Iceberg 的增强功能,Apache Iceberg 是其去年添加到数据平台的开放表格式。其中最大的亮点是,Snowflake 客户可以像对待原生的 Snowflake 内部表一样对待 Iceberg 表,从而有效地消除了双层系统。
任朝阳 · 2025-04-10 14:03 - LLM数据分类分级:降临的"神器"还是"伪需求"?
各大厂商、技术大会都在鼓吹用LLM能彻底革了我们那套靠正则表达式和关键字硬撑的数据分类分级体系的命。有趣的是,LLM在数据分类分级领域,就像一辆新能源汽车——很酷、很想要,但多数企业真实的需求可能只是一辆电瓶车。
任朝阳 · 2025-04-10 10:10 - 从DB-Engines排名攀升看TiDB全球突破之路
一批数据库新势力以创新谋发展,在智能化这场大变革中发挥越来越重要的作用。近年来,我们看到成立至今已十年的原生分布式关系型数据库TiDB在全球排名不断攀升,成绩斐然,以TiDB为代表的数据库新势力正展露头角,书写新的历史。
任朝阳 · 2025-04-10 09:21 - CDO 的价值要求:通过 Agentic AI 推动业务影响
如今,CDO 需要做的不仅仅是谈论 AI 驱动的决策,他们必须让其发挥作用。否则,他们可能会陷入与之前许多人相同的陷阱:大规模的 AI 投资永远不会转化为商业价值。
任朝阳 · 2025-04-09 11:38 - 蚂蚁数科全球化新进展 海外总部落户香港
4月8日,香港特区政府引进重点企业办公室(引进办)举办第四批重点企业伙伴签约仪式。在香港特别行政区财政司司长陈茂波见证下,蚂蚁集团旗下数字科技公司(蚂蚁数科)正式成为香港特区政府“重点企业伙伴”并宣布其海外总部落户香港。此次合作标志着香港政府对蚂蚁数科在AI大模型、Web3技术及跨境数字基建领域创新能力的认可,亦为香港巩固国际金融与科创中心地位注入新动能。
任朝阳 · 2025-04-08 20:46 - 数据库选型和数据库应用已经是两股道上的车了
这两年是数据库国产化替代的重点年份,很多不太想动的用户也开始有所动作了。我最近和一些国产数据库用户沟通的时候,大多数听到的都是他们的使用心得,对于选型方面的关注反而少了不少。
任朝阳 · 2025-04-08 15:23 - 从数据仓库到Lakehouse:DBA 的机遇与挑战
Lakehouse和数据仓库在现代数据架构中取得了一定的成功,但数据湖的出现为数据库管理员(DBA)带来了新的挑战和机遇。这对 DBA 及其职业生涯有何影响?随着数据湖使用范围的扩大,他们的角色将如何演变?让我们来探讨Lakehouse时代 DBA 的概念、挑战和机遇。
任朝阳 · 2025-04-08 10:04 - IDC 和 Gartner 称 GenAI 投资正在加速
Gartner 在报告中指出,2025 年全球 GenAI 支出将增长 76.4%,达到 6440 亿美元。该分析机构称,其中约80%的支出将用于人工智能设备和服务器,约370亿美元用于软件,280亿美元用于服务。
任朝阳 · 2025-04-07 10:51 - 超越RAG构建更加强大的AI系统
本文探讨了为什么 RAG 尽管很实用,但与真正的记忆系统有着根本的不同,以及为什么我们需要超越 RAG 来开发具有更像人类的记忆能力的人工智能。正如我们所看到的,记忆不仅仅是检索信息——它还涉及理解背景、建立联想,也许最重要的是,知道要忘记什么。
任朝阳 · 2025-04-07 09:56 - 重构智能联接:华为数据通信用AI打开千亿级市场
华为数据通信产品线以AI重构网络能力,推动 “基础联网”向“智能体验”跃迁。在华为中国合作伙伴大会2025上,华为数据通信产品线副总裁赵志鹏接受了媒体专访,深入解读了华为数据通信的战略布局、技术突破与生态协同。
任朝阳 · 2025-04-02 16:15 - 一文看懂“深入的”数据分析:分析方法,MECE,业务建议
经常有同学抱怨:感觉平时做的都是描述性统计,同比、环比,深入的数据分析到底怎么做?今天系统地讲解一下。话不多说,直接上干货。
任朝阳 · 2025-04-02 15:36 - 如何确保关系型数据库长期可维护性?
驾驭关系型数据库可维护性的复杂性需要的不仅仅是技术,还需要战略远见和对最 佳实践的深刻理解。本文通过该领域资深专家的真知灼见,深入探讨了确保数据库可用、好用的关键技术。了解根据业务需求调整数据库设计、优化性能和长期确保数据完整性的基本步骤。
任朝阳 · 2025-04-02 10:46 - 别再迷信“大而全”!企服产品为什么越做越平庸?
在企服市场里,总有人迷信“大而全”的魔法。他们幻想着一款产品能像瑞士军刀般无所不能,一次性解决客户的所有需求。然而现实却像一把钝刀,割不开市场的硬壳。
任朝阳 · 2025-04-01 14:08 - MCP会成为Agentic AI的标准吗?
在为代理人工智能制定通信标准的竞赛中,MCP 显然处于领先地位。除非另一家人工智能巨头很快提出与之竞争的协议,否则 MCP 可能会以先发优势胜出。
任朝阳 · 2025-04-01 14:03 - 3月数据库圈值得关注的事 | 2025
本月,Gartner发布2025年数据和分析重要趋势;ClickHouse收购开源可观测性平台HyperDX;TigerGraph推出混合搜索功能;OceanBase举行首届合作伙伴大会,并重磅发布全新 OceanBase 单机版产品……
任朝阳 · 2025-03-31 15:22 - 人工智能和 Gen AI 项目为何失败率高
研究表明,70-80% 的 AI 项目未能实现其预期价值。至关重要的是,罪魁祸首往往不是技术本身,而是领导力和战略缺失。下面,我们从领导的角度分析常见的失败点:涵盖战略、文化、运营和技术挑战,并提出解决方案。
任朝阳 · 2025-03-31 13:47 - GenAI 正在重塑数据科学团队
生成式人工智能 (GenAI) 为缩短开发周期、减少技术和维护工作量以及实现以前看似遥不可及的创新用例打开了大门。与此同时,它也带来了新的风险,比如幻觉和对第三方 API 的依赖。
任朝阳 · 2025-03-31 13:42 - 蚂蚁数科CTO王维:可信智能体是产业AI规模化落地"必选项"
“在产业化场景中,任何一个小错误都可能导致巨大的损失。因此,通过可信技术搭建可靠、可控、可优化的智能体应用,将会成为产业规模化应用AI必需的基础设施。”在3月28日中关村论坛“未来产业创新发展论坛”上,蚂蚁数科CTO王维表示。
任朝阳 · 2025-03-28 16:06 - 你需要这样一个数据治理框架
尽早建立清晰的框架至关重要。它阐明了什么是数据治理,什么不是数据治理,有助于避免混淆、设定期望并推动采用。结构良好的框架提供了简单、可重复的视觉效果,您可以反复使用它来解释数据治理以及您计划如何在整个组织中实施它。
任朝阳 · 2025-03-28 09:26