Web 2.0 靈活運用自主學習班:「Google 搜尋技巧與進階應用」講義
講義下載
本講義除供線上瀏覽外,另提供 Adobe PDF 格式的檔案,下載網址為:
http://Jedi.org/p4/slide/20080421-20080425/handout-google.pdf
簡介
Google 是近年來急速竄升的一套搜尋引擎,其特色是以專用的演算法替頁面索引評分,再按照其得分將搜尋結果排序,而達到「找出人們最想要的資訊」的目的。此處提到的演算法,係以 Google 創辦人之一 Larry Page 當年所提出的論文為基礎,因此命名為 PageRank;所以這裡的 Page 並不是「網頁」的意思,而是發明者的名字。
基本搜尋
Google 並不是個自然語言提問式的搜尋引擎,意思就是說你不能像在對魔鏡說話一樣,輸入一整個問句,然後期盼 Google 回答你提出的問題。Google 採用的方式是關鍵字檢索,因此搜尋的時候必須輸入若干關鍵字,然後 Google 就會找出含有那些關鍵字的網頁或檔案來。
搜尋的時候有一些細節需要注意一下:
- 搜尋中文時,詞與詞之間可以用空格隔開;不過就算不隔開,Google 也會自己判斷切詞
- 如果不希望 Google 切詞,可以用一組「"」引號來包住整個關鍵詞組
- 搜尋英文時,大小寫沒有差別
- 搜尋英文時,Google 會試著展開頭文字
- 字詞的順序很重要,Google 會優先找出吻合出現順序的結果
- Google 會忽略某些常用字、詞,例如:
- where
- how
- the
- and
- 的
- Google 還會忽略掉特殊符號,例如:
- !
- ?
- .
- @
- Google 的預設搜尋方式是取交集,也就是所有的關鍵字都出現纔算吻合;如果想用「聯集」式搜尋(也就是「或」),則可以用大寫的「OR」來隔開關鍵字
- 如果想排除特定的關鍵字,可以在該關鍵字前面加一個減號「-」
- 如果要搜尋的關鍵字包含數值,則可以用兩個點號「..」來設定數值範圍
- Google 「好手氣」會直接連去第一個搜尋結果,而不是列出搜尋結果清單
- Google 還會在搜尋結果中列出可能的拼字建議、相近字詞、同音字詞、通同字詞等搜尋建議,直接點擊即可以 Google 建議的字詞再搜尋一遍
- 在台灣版的 Google 搜尋當中,可以指定尋找繁簡中文的網頁、繁體中文的網頁或位於台灣的網頁
- 尋找所有網頁或繁簡中文的網頁時,Google 會自動做繁簡轉換,所以輸入繁體中文也能找到對應的簡體中文內容
搜尋技巧
光是利用前述的搜尋技巧,就可以找到許多資料了;但是如何指定關鍵字,卻是個大學問。關鍵字用得好,就能夠過濾掉許多無用的網頁,迅速得到真正所需的精確結果。那麼究竟該如何指定關鍵字呢?
訣竅在於,預先設想你所要找的網頁上,會如何撰寫那些內容。
Google 的搜尋功能是建立在預先製作的網頁索引上,而網頁索引是以實際的網頁內容做成的,所以一組符合實際內容的關鍵字詞,將更能精確地找出特定的網頁。舉例來說,因為許多中文網頁中,初次翻譯的專有名詞都會以括號註明英文原文,所以搜尋時輸入英文專有名詞,並指定搜尋範圍為繁體中文的網頁,就可以查詢該專有名詞的慣用中文翻譯。
又例如 Apache 網頁伺服器預設的目錄內容清單畫面,標題會是「Index of」接著目錄名稱,然後畫面中會列出該目錄所有的檔案檔名及副檔名,所以我們在搜尋時使用「"Index of"」以及「mp3」當關鍵字,就可以找到能直接下載 MP3 檔案的地方。
在設想目標網頁的樣子時,還可以參考一些 Google 的評估原則:
- 文件的標題比文件的內容重要
- 越接近文件開頭部分的內容越重要
- 在同樣位置(例如文件的標題)處,總長度越短的話,則每個字詞越重要
- 不同國家版本的 Google,在排列各種語言內容的順序上會有所不同
因此,越是能指定到文件重要部分的關鍵字,就越能找出特定的網頁或檔案。
進階搜尋
除了直接以前述語法搜尋關鍵字外,Google 還提供了進階搜尋功能。在進階搜尋的畫面中,可以指定各種搜尋細節:
- 包含全部的字詞。就跟平常輸入關鍵字一樣。
- 包含完整的字句。相當於使用引號「"」搜尋詞組的功能。
- 包含任何一個字詞。相當於使用英文大寫「OR」的聯集搜尋功能。
- 不包括指定字詞。相當於使用減號「-」的搜尋功能。
- 每一頁要列出的搜尋結果筆數。可以從 10、20、30、50、100 間選擇。
- 語言。可以指定要搜尋的網頁內容語言,例如繁體中文。
- 區域。可以指定要搜尋的網頁位於哪個國家,例如台灣。
- 檔案類型。Google 除了搜尋網頁之外,還可以直接搜尋這些檔案格式的內容:
- Adobe Acrobat PDF (.pdf)
- PostScript (.ps)
- Autodesk DWF (.dwf)
- Google 地球 (.kml / .kmz)
- 微軟 Excel (.xls)
- 微軟 PowerPoint (.ppt)
- 微軟 Word (.doc)
- RTF (.rtf)
- Flash (.swf)
- 日期。指定搜尋的日期範圍(多久以內更新的網頁或檔案):
- 任何時間
- 過去 24 小時內
- 過去一週內
- 過去一個月內
- 過去 2 個月內
- 過去 3 個月內
- 過去 6 個月內
- 過去一年內
- 字詞位置。指定關鍵字要在網頁的哪個部分出現:
- 任何位置。這就是平常搜尋的預設值。
- 標題。指定關鍵字必須出現在網頁標題。這個選項也可以在搜尋輸入框直接用「intitle:」接上關鍵字詞;如果要指定所有的關鍵字詞都要出現在網頁標題的話,也可以用「allintitle:」。
- 內文。指定關鍵字必須出現在網頁的實際內文中。這個選項也可以在搜尋輸入框直接用「intext:」接上關鍵字詞;如果要指定所有的關鍵字詞都要出現在網頁實際內文中的話,也可以用「allintext:」。
- URL。指定關鍵字必須出現在網頁提到的網址之中。這個選項也可以在搜尋輸入框直接用「inurl:」接上關鍵字詞;如果要指定所有的關鍵字詞都要出現在網頁提到的網址中的話,也可以用「allinurl:」。
- 在網頁的連結內。指定關鍵字必須出現在網頁內的定位錨之中。這個選項也可以在搜尋輸入框直接用「inanchor:」接上關鍵字詞;如果要指定所有的關鍵字詞都要出現在網頁內的定位錨的話,也可以用「allinanchor:」。
- 網域。指定祇要在哪些網域之中搜尋,或者是要排除哪些網域。這個功能也可以在搜尋輸入框直接用「site:」接上指定的網域。這個功能可以做為任何網站的「站內搜尋」之用。
- 使用權。指定要針對採用某些創用 CC 授權的網頁內容來搜尋:
- 不依授權來搜尋。不做任何限制,這也是預設值。
- 可任意使用或分享。搜尋採用創用 CC 「姓名標示」、「姓名標示─非商業性」、「姓名標示─非商業性─禁止改作」、「姓名標示─非商業性─相同方式分享」、「姓名標示─禁止改作」、「姓名標示─相同方式分享」授權釋出的內容。
- 即使是商業用途,亦可任意使用或分享。搜尋採用創用 CC 「姓名標示」、「姓名標示─禁止改作」、「姓名標示─相同方式分享」授權釋出的內容。
- 可任意使用、分享或修改。搜尋採用創用 CC 「姓名標示」、「姓名標示─非商業性」、「姓名標示─非商業性─相同方式分享」、「姓名標示─相同方式分享」授權釋出的內容。
- 即使是商業用途,亦可任意使用、分享或修改。搜尋採用創用 CC 「姓名標示」、「姓名標示─相同方式分享」授權釋出的內容。
- SafeSearch。選擇是否要用「安全搜尋」的功能,將成人情色內容濾掉不顯示。
- 類似網頁。搜尋與指定網址內容相似的網頁。這個功能也可以在搜尋輸入框直接用「related:」接上指定網址。
- 連結。搜尋有連到指定網址的網頁。這個功能也可以在搜尋輸入框直接用「link:」接上指定網址。
其他功能
除了上述的進階搜尋選項外,Google 搜尋還有一些額外的功能:
頁面快取
Google 會將網頁內容「快取」下來暫存,除了可以在搜尋結果清單中按「頁面快取」的鏈結外,也可以在搜尋輸入框直接用「cache:」接上指定網址來取用快取中的網頁。
網頁資訊
在搜尋輸入框直接用「info:」接上指定網址,就可以得到該網址的各項相關資訊,包括頁面快取、類似網頁、逆向連結等。
名詞定義
在搜尋輸入框直接用「define:」接上指定關鍵字,就可以查詢該關鍵字在各大字典、百科之中的定義。
翻譯
在台灣版的 Google 搜尋輸入框直接用:「翻譯」、「fy」或「FY」(後兩者為「翻譯」的拼音的縮寫)空格後接上要翻譯的英文單字,則可以查詢其中文翻譯;反之若接上中文,則可以查詢其英文翻譯。
曆法轉換查詢
在台灣版的 Google 搜尋輸入框中直接輸入指定曆法的指定日期資訊,則可以查詢相關的曆法轉換資訊。可用的曆法關鍵字包括了:
- 公曆
- 國曆
- 農曆
- 陽曆
- 陰曆
另外也可以使用拼音的縮寫,例如「gl」、「nl」等。指定曆法之後可以接上:
- 日期
- 節氣名稱
- 節日名稱
並可以指定年份,或者用「今年」、「去年」、「明年」等關鍵字;如不輸入年份,則會視為今年。
計算機
可以在搜尋輸入框直接輸入數學運算式,Google 會計算出結果。可以使用的運算符包括了:
- 加「+」
- 減「-」
- 乘「*」
- 除「/」
- 乘冪(次方)「^」
- 階乘「!」
- 餘數「%」
- 組合運算「選」或「choose」
- 方根「開……次方」或「……th root of」
- 百分比「%」或「% of」
- 平方根「sqrt(……)」
- 三角函數「sin(……)」、「cos(……)」、「tan(……)」、「cot(……)」、「sec(……)」、「csc(……)」
- 以 10 為底的對數「log(……)」
- 自然對數「ln(……)」
- 優先運算「(……)」
計算的時候除了用十進制的數字外,也可以用:
- 十六進制「0x……」
- 八進制「0o……」
- 二進制「0b……」
- 科學記數「……e……」
此外 Google 還認得許多不同的常數,例如:
- 「圓周率」、「pi」
- 虛數「i」
- 自然常數「e」
- 「光速」、「c」、「the speed of light」
- 「黃金分割率」、「phi」
- 「普朗克常數」、「h」
單位換算
Google 可以做各種度量衡單位及匯率換算,祇要在搜尋輸入框中輸入一種單位及其數值,再輸入換算關鍵字,接著另一種單位,就能夠進行換算。換算關鍵字包括了:
- 等於多少
- =?
- 表示成
- ->
- 換成
- 是幾
至於單位及幣別,則可以任意使用中文、英文、縮寫等。因此可以做下列各種轉換及運算:
- 3.5 USD =? GBP
- 10港幣 -> 印尼盧比
- 8台幣換成泰國的貨幣
- 30 港幣每公升 =? 美元每加侖
- 一磅=?克
- 光速乘以二秒等於多少公里
- 1 a.u./c
- 1.21 GW / 88 mph
- e^(i pi)+1
- 1加侖等於多少升
- 1市兩=?磅
- 30度的正弦
- G*(6e24 kg)/(4000 miles)^2
- XVII 表示成中文
- 地球半徑/月亮半徑
- 恆河沙乘以不可思議減無量加大數除以阿僧祇等於多少
- 天上一日