未验证 提交 8173e491 编写于 作者: 飞龙 提交者: GitHub

Merge pull request #188 from xd122/xd-branch

A)20190423:修改单词翻译错误 院子=》原子
......@@ -466,7 +466,7 @@ Spark Streaming 提供了两种内置的 streaming source(流的数据源)
Spark Streaming 将监控`dataDirectory` 目录并且该目录中任何新建的文件 (写在嵌套目录中的文件是不支持的)。注意
* 文件必须具有相同的数据格式。
* 文件必须被创建在 `dataDirectory` 目录中,通过 atomically(子的)_moving(移动)_ 或 _renaming(重命名)_ 它们到数据目录。
* 文件必须被创建在 `dataDirectory` 目录中,通过 atomically(子的)_moving(移动)_ 或 _renaming(重命名)_ 它们到数据目录。
* 一旦移动,这些文件必须不能再更改,因此如果文件被连续地追加,新的数据将不会被读取。
对于简单的文本文件,还有一个更加简单的方法 `streamingContext.textFileStream(dataDirectory)`。并且文件流(file streams)不需要运行一个接收器(receiver),因此,不需要分配内核(core)。
......@@ -1610,4 +1610,4 @@ Output operations(输出操作)(如 `foreachRDD`)具有 _at-least once_
* [StreamingContext](api/python/pyspark.streaming.html#pyspark.streaming.StreamingContext)[DStream](api/python/pyspark.streaming.html#pyspark.streaming.DStream)
* [KafkaUtils](api/python/pyspark.streaming.html#pyspark.streaming.kafka.KafkaUtils)
* 更多的示例在 [Scala](https://github.com/apache/spark/tree/master/examples/src/main/scala/org/apache/spark/examples/streaming)[Java](https://github.com/apache/spark/tree/master/examples/src/main/java/org/apache/spark/examples/streaming)[Python](https://github.com/apache/spark/tree/master/examples/src/main/python/streaming)
* 描述 Spark Streaming 的 [Paper](http://www.eecs.berkeley.edu/Pubs/TechRpts/2012/EECS-2012-259.pdf)[video](http://youtu.be/g171ndOHgJ0).
\ No newline at end of file
* 描述 Spark Streaming 的 [Paper](http://www.eecs.berkeley.edu/Pubs/TechRpts/2012/EECS-2012-259.pdf)[video](http://youtu.be/g171ndOHgJ0).
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册