去年有一则新闻相信引起了IT圈的轰动–【热点】Hadoop已死,后Hadoop时代的数据战略–逼迫本地大数据公司进入寒冬的原因除了同行的挤压,最重要的还是云市场雪崩式的发展。
今天来看看微软这片雪花,由于起步较早,它的大数据平台也是基于Hadoop的PaaS,提供了
- 100%兼容Apache Hadoop的云端服务,支持Hadoop的开发生态系统,如HBase,Hive,Spark,Storm等;
- 按需灵活扩展,计算节点资源和存储资源可以单独扩展
- 兼容结构化、半结构化和非结构化数据
- 丰富的编程扩展能力,适用于多种语言,包括C#、Java、.NET等
- 无需采购或维护硬件
- 集成PowerBI和机器学习实现BI和智能大数据场景应用
Hadoop的另一个死因是它不具有实时数据处理能力,往往要借助于ODS,甚至在很多时候只能用作归档数据库。而Azure的智能分析可以从所有IoT设备和网关即时分析数据,这项功能也被称为流分析,它能无缝集成Azure IoT中心和Azure IoT套件,以便从IoT设备和应用程序对数据启用功能强大的实时分析。
Azure的 流分析还支持简单开发大规模并行的复杂事件处理(CEP)管道,其使用非常简单的声明性SQL(例如语言),借助对临时逻辑的嵌入式支持,制作强大的实时分析。各种现成的连接器、调试和作业监控功能通过显著降低所需的开发人员技能来帮助减少成本。
它的收费方式也较为灵活,用户无需担心基础架构,无需管理服务器、虚拟机或集群,在几秒钟内即可开始并立即为任何作业扩展处理功能,从一个流单位扩展到数百个流单位。用户仅需为每个作业使用的处理付费。
这里有人要问了,国内版的Azure可用么。小编想告诉大家,Azure流分析已满足国内所有主要的合规性要求,在全球19个Azure区域(包括中国大陆和德国)均有提供。
接收到流数据后,分析服务协助将其与现有结构化数据统筹建模,并且兼容企业版的SQL分析服务,Azure的分析服务同时具有以下几个特点:
- 快速开始,高效扩展:使用Azure资源管理器可在几秒钟内创建和部署Azure分析服务实例,而使用备份还原可快速将现有模型移动到Azure分析服务,并利用云的可伸缩性、灵活性和管理优势增加、减少或暂停服务;
- 将复杂数据转换为单一版本的事实真相:将多个源数据合并成单个易于理解和使用的受信任BI语义模型。通过简化数据及其基础结构的视图为业务用户启用自助服务和数据发现;
- 使性能与业务速度相匹配:缩短在大型和复杂数据集上获取见解的事件。快速响应时间意味着BI解决方案能满足业务用户的需求并与业务保持同步。使用DirectQuery连接到实时操作数据,同时密切关注业务动向
与Azure流和分析服务类似的,但只在国际版才提供的服务叫做Azure Databricks,由于国内版没有此项服务这里就不做过多展开,以下是它的数据流向图。
在对接如此多的数据源后,面对这些原始事件,普通的流管道是有超时时间的,同时在不确定OLAP和OLTP需求之前,也无法轻易地直接将其转存到任何一个持久化场所。这里就需要一个事件中心(Event Hub)来充当大数据的入口。
Azure的事件中心是高度可缩放的数据流式处理平台和事件引入服务,能够每秒接收和处理数百万事件。事件中心可以处理和存储分布式软件和设备生成的事件、数据或遥测。具有以下几大特点。
- 每秒对数百万事件进行流式处理;
- 处理相同数据流中的实时和批处理;
- 利用完全托管的平台型服务;
- 处理容量、种类和速度;
- 通过多语言支持进行跨平台开发。
小编曾经在本刊中发表过一篇关于Azure数据工厂的文章(Azure数据工厂),它其实也是Azure智能分析方向的产品。在数据工厂服务中可以创建数据管道来转移数据,然后按制定的计划(每小时、每日、每周等)运行管道。该服务还提供丰富的可视化效果来显示数据管道之间的历史记录和依赖项,用户可以通过单个统一视图监视管道,查明问题和设置监视报警。
说到微软的智能分析,大家一定会想到PowerBI。是的,作为商业分析工具,PowerBI可连接数百个数据源、简化数据准备并提供即席分析,生成美观的报表并进行发布,供组织在Web和移动设备上使用。并且每个用户都可以创建个性化的仪表盘,获取针对其业务的全方位独特见解。在企业内实现扩展并内置管理与安全性,与O365无缝对接。
当然,如果目前的企业已经有自己的应用了,可以考虑使用PowerBI的植入版(PowerBI Embedded),相当于将云端PowerBI的本地代理,相较于完整的PowerBI解决方案,植入版更适合ISV或开发人员,将可视化简单地嵌入到应用,并且最小化企业对Azure的依赖。
- 混合云集成方案Azure Arc - 2020年3月28日
- 【全网首播:Azure大全】11. 开发人员工具与Azure Stack - 2020年2月22日
- 【全网首播:Azure大全】10. 安全性与标识 - 2020年2月22日
还没有评论