筆試時間:2015-9-20
筆試職位:機器學習/數據挖掘工程師
筆試城市:天津、深圳、南京等
一. 簡答題
1. new 和 malloc 的區別。
2. hash沖突是指什么?怎么解決?給兩種方法,寫出過程和優缺點。
3. 命中的概率是 0.25,若要至少命中一次的概率不小于 0.75,則至少需要幾次?
二. 算法設計題
1. 用C/C++寫一個歸并排序。
數據結構為struct Node{int v; Node next};
接口為 Node merge_sort(Node );
2. 設計S型層次遍歷樹的算法,比如根節點是第一層,第二層從左至右遍歷,第三層從右至左遍歷,第四層再從左至右遍歷,以此類推。
舉例:應依次輸出 1 2 3 6 5 4 7 8 9。
3. 一個url文件,每行是一個url地址,可能有重復。
(1)統計每個url的頻次,設計函數實現實現。
(2)設有10億url,均長度是20,現在機器有8G內存,怎么處理,寫出思路。
三. 系統設計題
自然語言處理中的中文分詞問題,前向最大匹配算法(FMM)。
注:題目舉例說明了FMM的基本。
(1)設計字典的數據結構 struct dictnote。
(2)用C/C++實現FMM,可選接口為
int FMM(vector iLetters, dictnode iRoot, vector oResults);
其中 iLetters 為待分詞的句子,比如 {“小”,“明”,“今”,“天”,“買”,“了”,“i”,“p”,“o”,“n”,“e”,“6”},
iRoot 是字典, oResults 保存輸出結果,即分詞的位置。也可以自己設計接口。
(3)收集了一些手機品牌的字典,如{iphone, 諾基亞}。
現在要求查找包含這些手機品牌的網頁,比如包含 iphone6, 諾基亞 9973 等。
怎么修改FMM實現這個功能,可以寫偽代碼。
2020年河北新聞網兩學一做
時間:2023-09-18 07:0:242020年河北新聞網兩學一做
時間:2023-09-15 11:0:59兩學一做學習教育知
時間:2023-09-21 06:0:302020年開展兩學一做學習教
時間:2023-09-19 21:0:30
2019百度校招產品經理筆試題和面試題答案2023-09-13 14:05:40
百度2019校園招聘筆試題和面試題答案2023-09-18 18:00:35
陜西國際商貿學院在重慶高考專業招生計劃(人數+代碼)2025-05-22 10:38:12
安徽建筑大學和新余學院哪個好 分數線排名對比2025-05-22 10:36:54
襄陽職業技術學院廣西錄取分數線及招生人數 附-2020最低位次排名2025-05-22 10:35:29
長江大學和新疆師范大學哪個好 分數線排名對比2025-05-22 10:34:16
錦州師范高等專科學校在遼寧高考專業招生計劃(人數+代碼)2025-05-22 10:32:49
山東高考排名在17550的考生能報什么大學(原創)2025-05-22 10:31:33
廣州華立學院的英語專業分數線(附2020-最低分排名怎么樣)2025-05-22 10:30:14
蘭州石化職業技術大學的理化測試與質檢技術專業分數線(附2020-最低分排名怎么樣)2025-05-22 10:29:06
泉州師范學院和亳州學院哪個好 分數線排名對比2025-05-22 10:27:53
貴州醫科大學在江西高考專業招生計劃(人數+代碼)2025-05-22 10:26:23
東莞城市學院和西安工商學院哪個好 分數線排名對比2025-05-22 10:24:51
山東海事職業學院的水路運輸安全管理專業分數線(附2020-最低分排名怎么樣)2025-05-22 10:23:44 


