• 阿里新一代实时计算引擎 Blink

    时间:2023-02-16 13:01:27

    实时计算时代来临随着互联网应用的普及、智能硬件的发展,数据的种类和规模都呈现了爆炸式的增长,各行各业都希望能够从大数据中发掘出更深层次的信息和知识,并产生实际价值。数据挖掘手段也逐渐从基本的数据统计向更高层次的机器学习和深度学习演变,但这些都需要强大的计算能力作为支撑,因此大数据价值的体现离不开大数...

  • 比DataX快20%!SeaTunnel同步计算引擎性能测试全新发布

    时间:2023-02-09 12:35:33

    点亮 ⭐️ Star · 照亮开源之路​​https://github.com/apache/incubator-seatunnel​​本月初,SeaTunnel同步计算引擎STE 2.3.0 beta2(commit id 7393c47)在社区的共同努力之下正式发布。与此同时,社区对大家期待的性...

  • 如何从google计算引擎连接到rails控制台

    时间:2023-01-16 09:48:21

    I have deployed a rails 4.2 app to googles cloud platform using runtime ruby. I have an instance running in googles compute engine that I can SSH onto...

  • 阿里妈妈Dolphin智能计算引擎基于Flink+Hologres实践

    时间:2023-01-12 16:19:09

    作者:徐闻春(花名 陌奈) 阿里妈妈事业部技术专家 本文整理至Flink+Hologres实时数仓Workshop北京站,点击查看视频回放>>> 阿里妈妈数据引擎团队负责广告营销计算引擎Dophin的开发,目前支撑百万级广告主的营销产品,支持万亿级数据毫秒级交互式人群圈选、洞察分析...

  • 比Hive还快10倍的大数据计算引擎

    时间:2022-12-29 13:53:51

    最近几年,Presto这个大数据组件越来越多地出现在程序员的岗位需求中,很多应届同学一番自我检查后发现,在学校都没怎么接触过,更不用说了解了。 某游戏公司岗位需求 Presto到底是个啥? 有什么用? 适合哪些业务场景?本文带你了解入门。 01 Presto的出现 在2012年以前,Facebook...

  • 图计算引擎分析——Gemini

    时间:2022-12-26 20:08:21

    Gemini 是目前 state-of-art 的分布式内存图计算引擎,由清华陈文光团队的朱晓伟博士于 2016 年发表的分布式静态数据分析引擎。Gemini 使用以计算为中心的共享内存图分布式 HPC 引擎。通过自适应选择双模式更新(pull/push),实现通信与计算负载均衡 [‎1]。图计算研...

  • 图计算引擎分析 ——Gemini

    时间:2022-12-26 15:02:27

    作者:京东科技 王军前言Gemini 是目前 state-of-art 的分布式内存图计算引擎,由清华陈文光团队的朱晓伟博士于 2016 年发表的分布式静态数据分析引擎。Gemini 使用以计算为中心的共享内存图分布式 HPC 引擎。通过自适应选择双模式更新(pull/push),实现通信与计算负载...

  • 开源分布式计算引擎 & 开源搜索引擎 Iveely 0.5.0 为大数据而生

    时间:2022-12-18 15:23:32

    Iveely Computin*生背景08年的时候,我开始接触搜索引擎,当时遇到的第一个难题就是大数据实时并发处理,当时实验室的机器我们可以随便用,至少二三十台机器,可以,却没有程序可以将这些机器的计算性能整合起来,后来听说了Hadoop,但是当时的hadoop还很脆弱(记得没错是0.2.0),源...

  • 比 DataX 快 20%!SeaTunnel 同步计算引擎性能测试全新发布

    时间:2022-11-16 12:11:57

    ​点亮 ⭐️ Star · 照亮开源之路https://github.com/apache/incubator-seatunnel ​本月初,SeaTunnel同步计算引擎STE 2.3.0 beta2(commit id 7393c47)在社区的共同努力之下正式发布。与此同时,社区对大家期待的性...

  • 比DataX快20%!SeaTunnel同步计算引擎性能测试全新发布

    时间:2022-11-16 12:08:21

    2022腾讯全球数字生态大会来袭,锁定11.30-12.1,不见不散!>>>

  • 开源分布式实时计算引擎 Iveely Computing 之 WordCount 详解(3)

    时间:2022-11-03 20:12:28

    WordCount是很多分布式计算中,最常用的例子,例如Hadoop、Storm,Iveely Computing也不例外。明白了WordCount在Iveely Computing上的运行原理,就很容易写出新的分布式程序。上一篇中已经知道了如何部署Iveely Computing以及提交任务,现在...

  • 数仓Hive和分布式计算引擎Spark多整合方式实战和调优方向

    时间:2022-09-13 09:50:55

    @目录概述Spark on HiveHive on Spark概述编译Spark源码配置调优思路编程方向分组聚合优化join优化数据倾斜任务并行度小文件合并CBO谓词下推矢量化查询Yarn配置推荐Spark配置推荐Executor CPU核数配置Executor CPU内存配置Executor 个数...

  • 【原创 Hadoop&Spark 动手实践 7】Spark 计算引擎剖析与动手实践

    时间:2021-07-15 06:02:37

    【原创Hadoop&Spark动手实践7】Spark计算引擎剖析与动手实践目标:1.理解Spark计算引擎的理论知识2.动手实践更深入的理解Spark计算引擎的细节3.通过编程案例加深理解【原创Hadoop&Spark动手实践7】Spark计算引擎剖析与动手实践的更多相关文章【Spa...