Hadoop快速入门
1、安装软件如果你的集群尚未安装所需软件,你得首先安装它们。以linux系统为例,见下图。

3、伪分布式模式的操作方法Hadoop可以在单节点上以所谓的伪分布式模式运行,此时每一个Hadoop守护进程都作为一个独立的Java进程运行。配置使用如下的 conf/hadoop-site.xml:

5、执行格式化一个新的分布式文件系统,如下图命令。

6、启动Hadoop守护进程:$ bin/start-all.shHadoop守护进程的日志写入到 铮喘饿怊${HADOOP_LOG_DIR} 目录 (默认是 ${HADOOP_HOME}/logs).浏览NameNode和JobTracker的网络接口,它们的地址默认为:NameNode - http://localhost:50070/JobTracker - http://localhost:50030/将输入文件拷贝到分布式文件系统:$ bin/hadoop fs -put conf input运行发行版提供的示例程序:$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'查看输出文件:将输出文件从分布式文件系统拷贝到本地文件系统查看:$ bin/hadoop fs -get output output $ cat output/*或者在分布式文件系统上查看输出文件:$ bin/hadoop fs -cat output/*完成全部操作后,停止守护进程:$ bin/stop-all.sh
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:90
阅读量:38
阅读量:84
阅读量:83
阅读量:44