文章詳情頁
java - hadoop數據查找
瀏覽:199日期:2024-02-06 11:45:32
問題描述
使用hadoop查找文件中是否含有某些字符串,也就是要查找出set(string)中每個string對應的那一行,每條數據都不重復,請問怎么可以快速的找到呢?我寫了簡單的
# map.shawk -F '03' ’$3==xxx{print $0}’ -
結果慢的要死,一直動不都不懂,請問有快點的辦法嗎?最好是可以一次性找出集合中所有的
問題解答
回答1:這個寫MR吧,如果你想省事就把數據導入到hive中,用sql 來解決
標簽:
java
相關文章:
1. boot2docker無法啟動2. 關docker hub上有些鏡像的tag被標記““This image has vulnerabilities””3. docker-compose中volumes的問題4. javascript - mock.js可以存儲數據嗎5. nignx - docker內nginx 80端口被占用6. docker安裝后出現Cannot connect to the Docker daemon.7. java - SSH框架中寫分頁時service層中不能注入分頁類8. golang - 用IDE看docker源碼時的小問題9. docker api 開發的端口怎么獲取?10. dockerfile - 為什么docker容器啟動不了?
排行榜

網公網安備