StreamSets 设计Edge pipeline

时间:2023-01-14 15:47:52

edge pipeline 运行在edge 执行模式,我们可以使用 data collector UI 进行edge pipeline 设计,
设计完成之后,你可以部署对应的pipeline到edge 设备

可以设计的edge pipeline

  • edge 发送pipeline
edge 发送pipeline 使用特定的orgin读取edge设备上的数据,这个pipeline 可以在将数据发送到data collector 之前进行数据的处理
  • edge 接收pipeline
接收pipeline可以接收来自edge 设备或者 data collector pipeline的数据

orgin 组件

  • Dev Random Record Source
  • Dev Raw Data Source
  • Directory Edge pipelines do not support multithreaded processing.
    In an edge pipeline, the Directory origin always creates a single thread to read the files even if you configure it to use multiple threads.
  • File Tail
    In edge pipelines, the File Tail origin can read a single set of files.
    If you configure multiple sets of files for the origin, the origin reads only the files configured in the first set.
  • HTTP Client
    In edge pipelines, the HTTP Client origin does not support batch processing mode, pagination, or OAuth2 authorization.
  • HTTP Server Edge pipelines do not support multithreaded processing.
    In an edge pipeline, the HTTP Server origin always creates a single thread to read the files even if you configure it to use multiple threads.
  • MQTT Subscriber Edge pipelines that use MQTT stages require using an intermediary MQTT broker.
    For example, an edge sending pipeline uses an MQTT Publisher destination to write to an MQTT broker. The MQTT broker temporarily stores the data until the MQTT Subscriber origin in the edge receiving pipeline reads the data.
  • Sensor Reader
  • System Metrics
  • WebSocket Client
  • Windows Event Log

processsor 组件

  • Delay
  • Dev Identity
  • Expression Evaluator
  • Field Remover
  • JavaScript Evaluator In edge pipelines, the JavaScript Evaluator processor does not support the sdcFunctions scripting object.
  • Stream Selector

destinations 组件

  • CoAP Client
  • HTTP Client
  • Kafka Producer
  • MQTT Publisher Edge pipelines that use MQTT stages require using an intermediary MQTT broker.
    For example, an edge sending pipeline uses an MQTT Publisher destination to write to an MQTT broker. The MQTT broker temporarily stores the data until the MQTT Subscriber origin in the Data Collector receiving pipeline reads the data.
  • Trash
  • WebSocket Client

错误记录处理

  • Discard 丢踢
    The pipeline discards the record.
  • Write to File 写到文件
    The pipeline writes error records and related details to a local directory on the edge device. Create another edge pipeline with a Directory origin to process the error records written to the file.
  • Write to MQTT 写到mqtt
    The pipeline publishes error records and related details to a topic on an MQTT broker. Create another edge or standalone Data Collector pipeline with an MQTT Subscriber origin to process the error records published to the broker.

支持的数据格式

  • json
  • text

限制

  • Email and webhook notifications cannot be sent by edge pipelines.
  • Rules and alerts cannot be defined for edge pipelines.
  • Edge pipelines support a limited number of record, math, pipeline, and string functions.
  • Edge pipelines do not support dataflow triggers.
  • Edge pipelines do not support multithreaded processing.
  • You cannot capture snapshots for edge pipelines.

参考资料

https://streamsets.com/documentation/datacollector/latest/help/datacollector/UserGuide/Edge_Mode/EdgePipelineTypes.html#concept_c14_m4r_4bb

 
 
 
 

StreamSets 设计Edge pipeline的更多相关文章

  1. StreamSets 相关文章

    相关streamsets 文章(不按顺序) 学习视频-百度网盘 StreamSets 设计Edge pipeline StreamSets Data Collector Edge 说明 streams ...

  2. StreamSets 管理 SDC Edge上的pipeline

    可选的方式: ui (data colelctor) 发送命令 UI 主要是创建edge pipeline 的时候进行edge server 的配置 默认是 http://localhost:1863 ...

  3. StreamSets 部署 Pipelines 到 SDC Edge

    可以使用如下方法: 下载edge 运行包并包含pipeline定义文件. 直接发布到edge 设备. 在data colelctor 机器配置并配置了edge server 地址(主要需要网络可访问) ...

  4. streamsets geoip 使用

    geoip 分析对于网站数据分析是很方便的 安装geoip2 下载地址 https://dev.maxmind.com/geoip/geoip2/geolite2/ 配置streamsets geoi ...

  5. 如何评价一个pipeline的好坏

    生物信息NGS相关软件众多. 常用的比对软件:bwa,bowtie: 去pcr重复的软件\:samtools,picard: calling variant:samtools/bcftools,gat ...

  6. pipeline 结构设计

    目录 一.pipeline步骤 二.案例 pipeline详解 只生成一次制品 不同环境部署 系统集成测试 指定版本部署 一.pipeline步骤 当团队开始设计第一个pipeline时,该如何下手呢 ...

  7. Netty源码分析--创建Channel(三)

    恩~,没错,其实这一篇才是真正的开始分析源码,你打我呀~. 先看一下我Netty的启动类 private void start() throws Exception { EventLoopGroup ...

  8. Jenkins教程(四)安装BlueOcean与Maven构建

    前言 本文旨在使用BlueOcean实现构建可视化与使用Maven构建上一节Jenkins教程(三)添加凭据与流水线拉取Git代码拉下来的代码 什么是Blue Ocean Blue Ocean 重新思 ...

  9. CNN作为denoiser的优势总结

    图像恢复的MAP推理公式: $\hat{x}\text{}=\text{}$arg min$_{x}\frac{1}{2}||\textbf{y}\text{}-\text{}\textbf{H}x| ...

随机推荐

  1. Oracle数据加载之外部表的介绍

    环境: 服务端:RHEL6.4 + Oracle 11.2.0.4 目录: 一. 创建外部表 1.1 创建外部表需要的目录 1.2 创建外部表 1.3 创建外部表源文件 1.4 查询外部表 二. 加载 ...

  2. os4开始CLLocationManager类中不支持locationServicesEnabled属性了

    locationServicesEnabled改为类方法 //判断定位服务是否开启 if ([CLLocationManager locationServicesEnabled]) { }

  3. linux下利用openssl来实现证书的颁发(详细步骤)

    1.首先需要安装openssl,一个开源的实现加解密和证书的专业系统.在centos下可以利用yum安装. 2.openssl的配置文件是openssl.cnf,我们一般就是用默认配置就可以.如果证书 ...

  4. hdu 3074 Multiply game(模板级线段树)

    离机房关门还有十分钟,这点时间能干些什么?故作沉思地仰望星空,重新捋一下一天的学习进度,或者,砍掉一棵模板级线段树. 纯模板,就是把单点更新,区间求和改为单点更新,区间求积. 1A. #include ...

  5. 加速Android Studio的Gradle构建速度

    在利用Android Studio做项目时,发现随着项目内资源的逐渐增多(或者项目创建时间太过久远,而又未经常打开),Android Studio的build速度也越来越慢.(P.S.在做我的CSGO ...

  6. MyBatis CRUD Java POJO操作

    <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE configuration PUBLIC ...

  7. Opencv如何捕获摄像头视频-OpenCV步步精深

    捕获摄像头实时图像 这一点非常非常重要,因为这一点关乎了以后我们进行各种各样的识别(人脸识别,车牌识别等等有趣的识别).opencv提供了一个接口,可以轻松的让我们实现这个功能.我们先来看一段代码,根 ...

  8. Jsonpath的写法

      JSONPath - 是xpath在json的应用. xml最大的优点就有大量的工具可以分析,转换,和选择性的提取文档中的数据.XPath是这些最强大的工具之一. 如果可以使用xpath来解析js ...

  9. linux中vim中文显示乱码

    这里所说的都是全局设定,打开vimrc文件后,只需要在文件最后添加以下代码就可以了: set fileencodings=utf-8,gb2312,gbk,gb18030 set termencodi ...

  10. generator&period;xml文件与相关配置插件

    一,generator.xml配置信息 1 <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE ...