免費免註冊,彰化一整天線上測驗:http://exam.bestdaylong.com/multiple6260.htm
( | ) | 1. | 大數據(Big Data)分析的數據多屬於非結構化全數據(Raw Data),因此大多採用 NoSQL 工具。下列何者是 NoSQ L 工具(1)Sybase (2)MariaDB (3)Access (4)BigTable | ||
( | ) | 2. | 存取大數據(Big Data)經常採用 NoSQL,下列何者是 No SQ L 的特點(1)採用非同步的複製 (2)只能使用結構化查詢語言 (3)資料表的模式須固定 (4)不能 Scale out 儲存容量 | ||
( | ) | 3. | 大數據(Big Data)增長的挑戰和機遇有三個方向,合稱 3 Vs。這三個方向為何(1)可視性(visualization)、合法性(validity)、速度(ve locity) (2)數量(volume)、真實性(veracity)、合法性(validity) (3)速度(velocity)、數量(volume)、多樣性(variety) (4)多樣性(variety)、真實性(veracity)、可視性(visualization) | ||
( | ) | 4. | 在 Hadoop 的 MapReduce 工具中使用外部執行檔來建立及執行 Map-Reduce 工作,需要使用下列哪一種技術(1)Virtual Machine (2)Streaming (3)Pipeline (4)Filter | ||
( | ) | 5. | 在 8 個位元的所有組合中,有幾種組合是「從 1 開始」且「以 00 結尾」(1)64 (2)128 (3)16 (4)32 | ||
( | ) | 6. | 大數據(Big Data)分析工具中,常用一些統計分析、繪圖軟體,以下何者屬於開放原始碼軟體(1)SPSS (2)SAS (3)MINITAB (4)R | ||
( | ) | 7. | 大數據(Big Data)分析大多分為兩階段分析,第一階段為全數據分析,提取指標數據,第二階段將提取指標數據進行測試、優化、建模、分析。下列哪項工具適合使用在第一階段(1)Python (2)Mathlab (3)Hadoop (4)R | ||
( | ) | 8. | 處理大數據(Big Data)會使用到資料計量單位 PB。1PB 約等於多少 GB?(1)1,000,000,000 (2)1,000,000,000,000 (3)1,000 (4)1,000,000 | ||
( | ) | 9. | 大數據分析工具 Hadoop 之資料處理採用映射歸納(Map /Reduce)方式,以下何者是屬於映射(Mapping)工作(1)將所有資料集中做計算 (2)把工作分散到各節點 (3)把各節點運算結果收回來歸納整合 (4)各節點獨立運算 | ||
( | ) | 10. | 從大數據(Big Data)的觀點來看,下列關於資料價值的敘述,何者正確(1)資料廢氣(Data Exhaust)沒有價值 (2)政府公開的資料沒有價值 (3)臉書(Facebook)表情符號的點擊數是有價值 (4)資料擺久一定不會貶值 | ||
( | ) | 11. | 大數據分析工具 Spark 框架之重要特色為所有的運算都在記憶體中執行,這樣的技術稱為(1)In-Memory Computing (2)Build-In Computing (3)Ubiquitous Computing (4)Distributed Computing | ||
( | ) | 12. | 大數據分析工具 Spark 框架的核心將資料抽象化成資料集,以直接在多台機器的記憶體處理資料,這樣的資料集稱為(1)In-Memory Dataset (2)Distributed In-MemoryDataset (3)In-Memory Distributed Dataset (4)Resilient Distributed Dataset | ||
( | ) | 13. | 下列何者為大數據分析工具 Hadoop 中類似 SQL 的查詢工具(1)Hive (2)HBase (3)Mahout (4)Pig | ||
( | ) | 14. | 關於 Hadoop 運作的敘述,下列何者正確(1)如果資料檔案太大,Hadoop 就不會儲存資料備份 (2)與關聯式資料庫相比,Hadoop 輸出的結果比較精準 (3)資料檔案一旦建立,就不允許修改 (4)Hadoop 的 NameNode 會將整個資料,直接轉移到任意一個 Da taNode 中 | ||
( | ) | 15. | 有關 R 程式語言的敘述,下列何者正確(1)尚未開放程式原始碼 (2)主要用於統計分析、資料探勘 (3)源自於 B 程式語言 (4)不具圖形使用者介面 | ||
( | ) | 16. | 下列何者是大數據(Big Data)的分析技術(1)Data Mining (2)Encounter (3)Angular 2 (4)Catia | ||
( | ) | 17. | EB、PB、TB 及 ZB 是大數據經常使用的資料計量單位。這些計量單位之間的大小排列,下列何者正確(1)PB>EB>ZB>TB (2)ZB>TB>PB>EB (3)TB>EB>PB>ZB (4)ZB>EB>PB>TB | ||
( | ) | 18. | 以下哪一個數字使用 IEEE754 浮點表示法儲存時會有誤差?(1)0.815 (2)0.5625 (3)0.5 (4)0.625 | ||
( | ) | 19. | 有關 Apache Spark 的敘述,下列何者正確(1)Streaming 中的互動式命令列介面,可以降低橫向擴展資料探索的反應時間 (2)不支援 SQL (3)Python 對即時資料串流的處理具有可擴充性及可容錯性等特點 (4)MLlib是機器學習演算法和 Graphx 圖形處理演算法的高階函式庫 | ||
( | ) | 20. | Hadoop 是一個分散式系統架構,可提供高傳輸率來存取應用程序的數據,適合做為大數據分析,其中家族成員中,何者是專做分散式儲存系統(1)MapReduce (2)HDFS (3)Hive (4)Ambari |