streamdata-io-reddit-search:使用Lambda将Streamdata.io Reddit搜索流式传输到Amazon S3 Data Lake

时间:2021-05-01 13:40:19
【文件属性】:
文件名称:streamdata-io-reddit-search:使用Lambda将Streamdata.io Reddit搜索流式传输到Amazon S3 Data Lake
文件大小:3.55MB
文件格式:ZIP
更新时间:2021-05-01 13:40:19
streaming reddit aws-lambda aws-s3 reddit-api Streamdata.io Reddit搜索流式传输到AWS S3 Data Lake(无服务器) 这是一个演示,它使用在AWS Lambda上运行的Streamdata.io作为“无服务器”功能来交付Reddit搜索流。 它旨在采用现有的JSON API,并使用服务器发送事件(SSE)将其转换为流API,使用JSON Patch应用增量更新,然后将结果流传输到Amazon S3上的数据湖存储中。 您将需要一个Streamdata.io帐户和应用程序密钥来运行此功能,需要Reddit帐户和应用程序,以及一个要在其中运行Lambda函数的AWS帐户,以及一个AWS S3来存储数据。 您可以将此流作为流运行最多五分钟(Lambda脚本的最大超时),然后每隔X分钟重新运行一次,或使用AWS CloudWatch Events进行其他调度。 提供可以根据需要打开或关闭的现有API流,从而向您的

网友评论