- 浅谈G行数据湖平台建设
数据湖是一种支持结构化、半结构化、非结构化等大规模数据存储和计算的系统架构,能够高效地对原始数据进行存储和取用,解决了传统数据仓库需要预先定义数据结构、海量数据加载慢的问题。
李代丽 · 2023-11-20 10:37 - 开源与自研的“战火”在大模型时代重燃
这几天朋友圈异常热闹,导火索来自前阿里AI科学家贾扬清的一则消息,他说某国产大模型抄袭了META 的LLaMA架构,并且只换了几个变量名称就说成是自研,谴责这种行为没有底线。
李代丽 · 2023-11-16 16:52 - 腾讯Q3ToB业务创新高,未来增长寄希望于大模型
腾讯发布最新财报。数据显示,腾讯2023年Q3的营收为1546亿元,同比增长10%。其中,金融科技与企业服务(简称“ToB业务”)占大头,营收额为520亿元,同比增长16%,占总营收的34%。
李代丽 · 2023-11-15 18:30 - 基于Doris实时数据开发的一些注意事项
基于Doris的一些存储实时数仓在越来越多的场景中开始有一些实践。大家也看到了这种方案频繁出现在社区分享中。但是我们得客观看待这种方案,基于存储的实时数仓有优势也有他的劣势,生产环境中我们要谨慎评估个人的业务场景。
李代丽 · 2023-11-15 17:16 - 大模型在银行业客服中心的应用浅析
为了提升客户体验和效率,金融机构不断探索自然语言处理、机器学习等技术手段来优化客服服务,其中大模型技术被广泛应用,成为当前最热门的研究方向之一,是目前通往AGI的实现方式。
李代丽 · 2023-11-14 16:21 - Kafka 正在成为新一代数据湖?
如果Kafka完成了数据湖能力的支持,那么对于整个数据产品来说就是一次整合和变革,将根本性缩短现有的数据处理链路,同时可以统一数据源,减少数据产品间的转换适配等成本。
李代丽 · 2023-11-13 10:14 - 分布式存储 Ceph 架构原理
如果单从架构上来看,对一些可以直接以对象方式存储及访问的场景来说,Ceph的IO深度以及接口的衔接维度看,更利于发挥其性能的优势。
李代丽 · 2023-11-13 09:58 - Q-SYS桥思数智AVC大会成功举办,展示高规格空间新趋势
让AV更智能的Q-SYS桥思在北京、成都、武汉及杭州成功举办“数智AVC大会”,以“共赢融合新时代”为题,展示崭新的高规格空间新趋势。
李代丽 · 2023-11-10 16:04 - 实施混合式数据分析平台的三个步骤
与数据基础设施关联较为紧密的任务,如数据获取和元数据变更协调,应由IT集中管理。与洞察消费者关联较为紧密的任务,如BI报表交付和自助服务分析,则应更多地由业务端参与或由业务领导者负责。
李代丽 · 2023-11-10 14:20 - 当生成式AI打响史诗级争夺战,亚马逊云科技围绕场景“走深向实”
一场史诗级的生成式AI争夺战正在打响!当各家企业都在秀自己的基础模型、大模型,亚马逊云科技从“场景”角度进行弯道超车,以全栈AI能力助力更多客户“走深向实”,为业务赋能。
李代丽 · 2023-11-10 10:09 - Kafka 在分布式系统中的 7 大应用场景
Kafka 是一个开源的分布式流式平台,它可以处理大量的实时数据,并提供高吞吐量,低延迟,高可靠性和高可扩展性。
李代丽 · 2023-11-09 11:19 - 边缘计算驱动工业大数据实现更高效赋能
边缘计算在制造业的发展中扮演着越来越重要的角色。随着工业互联网的普及和制造业数字化转型的加速,边缘计算能够帮助工厂和企业实现更高效、更实时的数据处理和分析。
李代丽 · 2023-11-07 17:50 - DataOps是现代数据栈的未来吗?
随着数据扩展需求,团队需要开始优先考虑其可靠性。本文主要探究为什么 DataOps是可能的答案,以及我们该如何开始DataOps。
李代丽 · 2023-11-07 14:47 - Gartner :45%CIO转向数字领导责任共担模式
在特许模式中,CIO还与其他高管共同负责技术治理。近一半的特许者型CIO(47%)认同业务部门应与IT分担合规和风险责任,而经营者型CIO中的这一比例仅为 19%。
李代丽 · 2023-11-03 17:56 - 阿里平头哥发布首颗存储主控芯片镇岳510,实现4μs超低时延
在2023云栖大会上,阿里巴巴平头哥发布旗下首颗SSD主控芯片镇岳510,该芯片为云计算场景深度定制,实现4μs超低时延,比业界主流降低30%以上,误码率低至10^-18,比业内标杆领先一个数量级。
李代丽 · 2023-11-01 15:50