旗下產業: A產業/ A實習/ A計劃
全國統一咨詢熱線:010-5367 2995
首頁 > 熱門文章 > 大數據分析 > 大數據分析命令行使用教程
大數據分析命令行使用教程
時間:2020-06-04來源:www.shunkai11.site點擊量:作者:Sissi
時間:2020-06-04點擊量:作者:Sissi


  在與數據科學緊密聯系的計算機科學領域,像開發人員一樣控制計算機是一項非常寶貴的資產。Unix命令行界面(CLI;您還將看到它稱為終端或bash,shell等),它使我們能夠執行更多操作。


  因此,我們推出了兩門全新的課程,涵蓋了Python中的數據分析師和Python路徑中的大數據分析的命令行基礎知識:


  1)命令行元素
  2)命令行中的文本處理


  參加這些課程不需要先決條件知識。


  你會學什么?


  在這兩個命令行課程中,您將學習如何使用Mac和Linux計算機上內置的Unix終端界面。不用擔心,我們還將為Windows用戶提供充分利用內容所需的工具。


  在第一門課程中,您將學習命令行界面是什么,為什么它在數據科學工作流程中很重要,以及如何通過給計算機提供稱為命令的指令來導航和管理計算機。您還將了解通配符和如何將它們連同像命令使用ls,mv,cp,mkdir,多為更快的搜索和工作流。


  第二療程的重點是基本的文本處理中的外殼,使用類似的命令head,cat,cut和grep。它涵蓋了如何組合這些命令以從更簡單的構建塊創建功能強大的命令鏈。您還將了解多用戶系統以及輸出重定向的功能。

與所有AAA教育課程一樣,這些新的命令行課程使用交互式命令行環境和答案檢查功能,使您可以直接在瀏覽器中應用和檢查正在學習的所有內容。


  學習命令行的12個理由


  從圖形用戶界面(GUI)切換到CLI可能會讓人感到不知所措,但是我們在這里為您提供幫助!為了讓您快速入門,以下是一些您應該學習命令行的原因。


  1.命令行技能很受歡迎并且薪酬豐厚


  根據2018年Stack Overflow的開發人員調查,bash / shell(即Linux命令語言解釋器家族)是整體使用頻率排名第六的語言,排在Python和R之前。它的薪水也比Python或R高進行調查。


  它還排在最想要和最喜歡的技術的列表中,而沒有列出最令人恐懼的技術列表。


  盡管StackOverflow的調查涵蓋了各種軟件開發人員和工程師,但命令行對于數據科學家而言尤其重要,因為Bash / Shell與 Python,IPython / Jupyter,TensorFlow和PyTorch等數據科學技術有著密切的聯系。Python Software Foundation進行的最新Python開發人員調查也支持這一點。


  2.命令行技能幫助構建可重復數據過程


  數據科學家的職責之一是確保經常(每天)定期獲取某些信息。大多數情況下,以相同的方式獲取,處理和顯示此數據。


  命令行非常適合此目的,因為命令易于自動化和復制。


  考慮以下情況。您的雇主決定投資于數據分析。幾位數據專業人員將加入該團隊。您的任務是確保他們的機器具備啟動所需的一切。如果可以使用CLI(命令語言解釋器),則可以編寫一些腳本來自動安裝,配置和測試所有內容。否則,您將不得不求助于GUI并使用相同的鼠標并在多臺計算機上反復單擊移動。


  這只是終端技能如何幫助使數據科學流程更具可擴展性和可重復性的一個示例。


  3.命令行技能使您更靈活


  在數據科學領域,您經常會發現,如果您可以使用終端而不用依賴于單擊GUI,則可以擁有更大的靈活性。由于命令行是運行其他程序的程序(因此稱為“ shell”),因此程序之間的交互通常更容易在命令行中進行調整。掌握了命令行命令后,編寫腳本就相對容易了,而Shell腳本使構建各種數據管道和工作流變得更加簡單。


  更廣泛地講,了解如何使用外殼為您提供了與計算機交互的第二種選擇。您隨時可以根據需要使用GUI,但是在需要的時候,命令行可以為您提供更多直接的功能和控制。


  4.使用文本文件更容易


  文本文件是存儲和處理數據的最常用方法之一,幾乎任何數據科學項目都將涉及文本文件的某些工作。因此,對于數據科學家而言,能夠快速有效地處理文本文件是一項非常有用的技能。


  該外殼程序具有非常強大的文本處理工具,例如AWK和sed,可幫助您熟悉文件并方便數據清理。


  例如,以下代碼使用AWK來打印名為的文件的第一和第三列a_csv_file,其中第二個字段的值為AAA教育,并使用逗號作為字段分隔符。

大數據分析

  只需要一行代碼!


  5.資源消耗少


  當您使用有限的計算資源或僅想最大化速度時,使用命令行實際上總是比使用GUI更好,因為使用GUI意味著資源必須專用于呈現圖形輸出。


  對于本地和遠程工作都是如此。遠程連接時,GUI消耗的帶寬比終端多得多,從而浪費資源。此外,使用GUI時,潛伏期(即“刺激和響應之間的時間間隔”)會更長,如果您要控制的鼠標落后于實際動作一兩秒,這會特別令人沮喪。如果您只是在命令行中輸入,則延遲可能會更短,并且也將更容易處理,因為您可以準確地知道任意給定時間的光標位置。


  6.您需要針對云的命令行技能


  云服務通常連接到命令行界面并通過命令行界面進行操作。對于深度學習等更高級的數據科學工作而言,這尤其重要,在該工作中,本地計算資源可能不足以完成您想執行的任務。


  7. Unix Shell技能可以很好地移植到其他Shell


  僅有一些流行的shell(bash,zsh,fish,ksh,tcsh,cmd,Windows PowerShell等),它們比其他的相似得多,因此可以輕松地在它們之間進行切換。當您使用需要某種CLI的在線服務時,此功能特別有用。另一方面,GUI是無止境的,學習一個GUI并不一定能幫助您學習其他GUI。


  8.您鍵入的速度可能比單擊速度快


  研究表明,鼠標使用速度相當快,而鍵盤的使用盡管學習曲線陡峭,但效率更高。

  換句話說:即使您覺得通過GUI快速工作,也很有可能至少在某些任務上在命令行中會更高效。


  9.審核和調試更容易


  由于在命令行上跟蹤所有活動非常容易,因此審核和調試要容易得多。您可以輕松地瀏覽日志以跟蹤您在外殼程序中執行的每個操作,而如果在使用GUI時單擊不正確會導致錯誤,則可能沒有任何記錄。


  10. Unix Shell隨處可用


  盡管它僅內置在Mac和Linux計算機上,但Windows用戶仍然可以通過WSL,Cygwin和MinGW之類的工具來享受樂趣。這意味著您在這些課程中學習的命令行技能幾乎可以在您遇到的每臺計算機上使用(包括您的個人計算機,無論使用哪種操作系統)。


  11.您可以利用語言的力量


  通過終端窗口與計算機交互時,我們使用命令。這些命令是語言的一部分,語言具有巨大的表達能力。


  命令行允許我們使用語言的力量以更精致,優雅和有效的方式與計算機交互。


  作者在總結類比時說:“真正的表達能力來自語言,示例和指向的結合。” 換句話說,如果可以使用CLI和GUI的健康組合,您將更有效率。這些命令行課程的重點并不是讓您完全放棄GUI,而是為您提供了另一個工具庫,可以使您在執行特定任務和工作流時更加高效。


  12.命令行比您想象的要簡單


  有一個誤解,使用命令行需要您知道數百條命令。實際上,盡管有數百種命令可供使用,但是您可能只需要這些命令中的一小部分即可完成大多數常見的數據科學任務。

?2007-2019/北京漫動者教育科技有限公司版權所有
備案號:京ICP備12034770號

?2007-2019/ www.shunkai11.site 北京漫動者教育科技有限公司 備案號:京ICP備12034770號 監督電話:010-62568622 郵箱:bjaaa@aaaedu.cc

亚洲 欧洲 日产 国