阿里妹导读:阿里巴巴数据体验技术团队从一开始建立就致力于打造数据领域体验技术的标杆。经过多年的深耕,形成了一整套面向两个阶段的用户产品的体验技术架构。本文重点介绍团队在SQL编辑器,BI平台,数据可视化,数字艺术,数据安全领域的相关见解,以及在技术上的建设和未来发展路径。
文末福利:快速入门Python数据可视化库Matplotlib。
在数字经济时代,数据的重要性堪比石油。大数据的四个特点:Volume(数据体量大)、Variety(数据类型繁多)、Velocity(处理速度快)、Value(商业价值高),只要合理利用数据并对其进行准确的分析,将会给企业带来很高的价值回报。
在数据建设侧,阿里巴巴数据体验技术团队完成了大型Web应用架构,TypeScript方案的Iron-Redux,加API服务Pont。上层特色的服务编排引擎和SQL编辑器的深挖,在工具层体验能力增色不少。在数据消费侧,我们致力于构建以BI为搭建数据报表等核心能力,上层特色的数据可视化,数据艺术和数据安全都在各领域有深度贡献。
SQL编辑器
在数据采集,加工,管理,应用的链路中,编辑器都充当着开发者最重要的伙伴。在前端领域,编辑器是高复杂度的领域,而SQL编辑器在这个领域中又是垂直领域的建设。我们在设计编辑器的过程针对理解语法和理解语境这两个点作了深入分析和优化。
理解语法
回顾人学习一门新语言的过程,无外乎两种方式,要么翻阅百科字典,从a到z,无论常用字还是生僻字,可以组成哪些词语,悉数记于脑中;要么与人交谈,记下其他人遣词造句的习惯,转为己用,与人交谈的次数越多,交谈的人群范围越广,积累下的话术也越为丰富,面对同一个问题,心中可供选择的答案也越多。
编辑器理解语法的过程亦是如此,基于产生式进行分析或是基于样本进行模型训练与识别。一门语言的产生式定义可以视为这门语言的百科字典,详尽的枚举出词法和语法的所有场景,清晰的描摹出边界。SQL语言的语法相对简单,结构性较强就比较适合采用基于产生式分析的方案。而对于Python,Shell这类语法复杂,或灵活度高的语言,基于产生式分析提供的关键词提示,在实际应用中难以真正起到提高开发效率的目的,基于业务场景的历史数据进行模型训练,提供包含业务含义的代码片段的提示显得更有意义。
架构图
理解语法可以说是编辑器最为基础的能力,不同的编辑器方案均有不同程度的实现,在我们的方案设计与实现的过程中,最为
转载请注明:http://www.0431gb208.com/sjszyzl/5378.html