Hadoop streaming v3.2で転置インデックスを実装してみる更新日:2019-03-18公開日:2019-03-15HadoopLinuxpythonUbuntuデータサイエンス Hadoop 最初は用語の説明からいきましょう。 Hadoopはビッグデータをより安価,より効率的に分散並列処理する必要があったgoogleが発表した論文をもとにしたシステムです。 HDFSファイルシステムとmapred […] 続きを読む