Apache Pig的Filter運算符用法是什么
Admin 2022-09-29 群英技術資訊 853 次瀏覽
在日常操作或是項目的實際應用中,有不少朋友對于“Apache Pig的Filter運算符用法是什么”的問題會存在疑惑,下面小編給大家整理和分享了相關知識和資料,易于大家學習和理解,有需要的朋友可以借鑒參考,下面我們一起來了解一下吧。FILTER 運算符用于根據條件從關系中選擇所需的元組。
下面給出了 FILTER 運算符的語法。
grunt> Relation2_name = FILTER Relation1_name BY (condition);
假設在HDFS目錄 /pig_data/ 中有一個名為 student_details.txt 的文件,如下所示。
student_details.txt
001,Rajiv,Reddy,21,9848022337,Hyderabad 002,siddarth,Battacharya,22,9848022338,Kolkata 003,Rajesh,Khanna,22,9848022339,Delhi 004,Preethi,Agarwal,21,9848022330,Pune 005,Trupthi,Mohanthy,23,9848022336,Bhuwaneshwar 006,Archana,Mishra,23,9848022335,Chennai 007,Komal,Nayak,24,9848022334,trivendram 008,Bharathi,Nambiayar,24,9848022333,Chennai
將此文件通過關系 student_details 加載到 的Pig中,如下所示。
grunt> student_details = LOAD 'hdfs://localhost:9000/pig_data/student_details.txt' USING PigStorage(',')
as (id:int, firstname:chararray, lastname:chararray, age:int, phone:chararray, city:chararray);
現在使用Filter運算符來獲取屬于Chennai城市的學生的詳細信息。
filter_data = FILTER student_details BY city == 'Chennai';
使用 DUMP 運算符驗證關系 filter_data ,如下所示。
grunt> Dump filter_data;
它將產生以下輸出,顯示關系 filter_data 的內容如下。
(6,Archana,Mishra,23,9848022335,Chennai) (8,Bharathi,Nambiayar,24,9848022333,Chennai)
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:[email protected]進行舉報,并提供相關證據,查實之后,將立刻刪除涉嫌侵權內容。
猜你喜歡
在上一章中,我們學習了如何將數據加載到Apache Pig中。你可以使用 store 運算符將加載的數據存儲在文件系統(tǒng)中,本章介紹如何使用 Store 運算符在Apache Pig中存儲數據。語法下面給出了Store語句的語法。
describe 運算符用于查看關系的模式。語法 describe 運算符的語法如下grunt> Describe Relation_name。例假設在HDFS中有一個包含以下內容的文件 student_data.txt 。
大數據時代,很多朋友對于大數據都比較好奇,因此這篇文章就給大家分享大數據的相關內容。文本主要的介紹的是關于大數據的關鍵技術,那么大數據的關鍵技術哪有些呢?接下來一起了解一下。
MapReduce - 讀取數據?通過InputFormat決定讀取的數據的類型,然后拆分成一個個InputSplit,每個InputSplit對應一個Map處理,RecordReader讀取InputSplit的內容給Map。InputFormat決定讀取數據的格式,可以是文件或數據庫等
GROUP 運算符用于在一個或多個關系中對數據進行分組,它收集具有相同key的數據。語法下面給出了 group 運算符的語法。grunt> Group_data = GROUP Relation_name BY age;
成為群英會員,開啟智能安全云計算之旅
立即注冊關注或聯系群英網絡
7x24小時售前:400-678-4567
7x24小時售后:0668-2555666
24小時QQ客服
群英微信公眾號
CNNIC域名投訴舉報處理平臺
服務電話:010-58813000
服務郵箱:[email protected]
投訴與建議:0668-2555555
Copyright ? QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版權所有
增值電信經營許可證 : B1.B2-20140078 ICP核準(ICP備案)粵ICP備09006778號 域名注冊商資質 粵 D3.1-20240008