Web 2.0 靈活運用自主學習班:「Google 搜尋技巧與進階應用」講義

講義下載

本講義除供線上瀏覽外,另提供 Adobe PDF 格式的檔案,下載網址為:
http://Jedi.org/p4/slide/20080421-20080425/handout-google.pdf

簡介

Google 是近年來急速竄升的一套搜尋引擎,其特色是以專用的演算法替頁面索引評分,再按照其得分將搜尋結果排序,而達到「找出人們最想要的資訊」的目的。此處提到的演算法,係以 Google 創辦人之一 Larry Page 當年所提出的論文為基礎,因此命名為 PageRank;所以這裡的 Page 並不是「網頁」的意思,而是發明者的名字。

基本搜尋

Google 並不是個自然語言提問式的搜尋引擎,意思就是說你不能像在對魔鏡說話一樣,輸入一整個問句,然後期盼 Google 回答你提出的問題。Google 採用的方式是關鍵字檢索,因此搜尋的時候必須輸入若干關鍵字,然後 Google 就會找出含有那些關鍵字的網頁或檔案來。

搜尋的時候有一些細節需要注意一下:

  • 搜尋中文時,詞與詞之間可以用空格隔開;不過就算不隔開,Google 也會自己判斷切詞
  • 如果不希望 Google 切詞,可以用一組「"」引號來包住整個關鍵詞組
  • 搜尋英文時,大小寫沒有差別
  • 搜尋英文時,Google 會試著展開頭文字
  • 字詞的順序很重要,Google 會優先找出吻合出現順序的結果
  • Google 會忽略某些常用字、詞,例如:
    • where
    • how
    • the
    • and
    如果希望不要忽略這些字、詞,可以在它們前面加上一個加號「+」
  • Google 還會忽略掉特殊符號,例如:
    • !
    • ?
    • .
    • @
  • Google 的預設搜尋方式是取交集,也就是所有的關鍵字都出現纔算吻合;如果想用「聯集」式搜尋(也就是「或」),則可以用大寫的「OR」來隔開關鍵字
  • 如果想排除特定的關鍵字,可以在該關鍵字前面加一個減號「-」
  • 如果要搜尋的關鍵字包含數值,則可以用兩個點號「..」來設定數值範圍
  • Google 「好手氣」會直接連去第一個搜尋結果,而不是列出搜尋結果清單
  • Google 還會在搜尋結果中列出可能的拼字建議、相近字詞、同音字詞、通同字詞等搜尋建議,直接點擊即可以 Google 建議的字詞再搜尋一遍
  • 在台灣版的 Google 搜尋當中,可以指定尋找繁簡中文的網頁、繁體中文的網頁或位於台灣的網頁
  • 尋找所有網頁或繁簡中文的網頁時,Google 會自動做繁簡轉換,所以輸入繁體中文也能找到對應的簡體中文內容

搜尋技巧

光是利用前述的搜尋技巧,就可以找到許多資料了;但是如何指定關鍵字,卻是個大學問。關鍵字用得好,就能夠過濾掉許多無用的網頁,迅速得到真正所需的精確結果。那麼究竟該如何指定關鍵字呢?

訣竅在於,預先設想你所要找的網頁上,會如何撰寫那些內容。

Google 的搜尋功能是建立在預先製作的網頁索引上,而網頁索引是以實際的網頁內容做成的,所以一組符合實際內容的關鍵字詞,將更能精確地找出特定的網頁。舉例來說,因為許多中文網頁中,初次翻譯的專有名詞都會以括號註明英文原文,所以搜尋時輸入英文專有名詞,並指定搜尋範圍為繁體中文的網頁,就可以查詢該專有名詞的慣用中文翻譯。

又例如 Apache 網頁伺服器預設的目錄內容清單畫面,標題會是「Index of」接著目錄名稱,然後畫面中會列出該目錄所有的檔案檔名及副檔名,所以我們在搜尋時使用「"Index of"」以及「mp3」當關鍵字,就可以找到能直接下載 MP3 檔案的地方。

在設想目標網頁的樣子時,還可以參考一些 Google 的評估原則:

  • 文件的標題比文件的內容重要
  • 越接近文件開頭部分的內容越重要
  • 在同樣位置(例如文件的標題)處,總長度越短的話,則每個字詞越重要
  • 不同國家版本的 Google,在排列各種語言內容的順序上會有所不同

因此,越是能指定到文件重要部分的關鍵字,就越能找出特定的網頁或檔案。

進階搜尋

除了直接以前述語法搜尋關鍵字外,Google 還提供了進階搜尋功能。在進階搜尋的畫面中,可以指定各種搜尋細節:

  • 包含全部的字詞。就跟平常輸入關鍵字一樣。
  • 包含完整的字句。相當於使用引號「"」搜尋詞組的功能。
  • 包含任何一個字詞。相當於使用英文大寫「OR」的聯集搜尋功能。
  • 不包括指定字詞。相當於使用減號「-」的搜尋功能。
  • 每一頁要列出的搜尋結果筆數。可以從 10、20、30、50、100 間選擇。
  • 語言。可以指定要搜尋的網頁內容語言,例如繁體中文。
  • 區域。可以指定要搜尋的網頁位於哪個國家,例如台灣。
  • 檔案類型。Google 除了搜尋網頁之外,還可以直接搜尋這些檔案格式的內容:
    • Adobe Acrobat PDF (.pdf)
    • PostScript (.ps)
    • Autodesk DWF (.dwf)
    • Google 地球 (.kml / .kmz)
    • 微軟 Excel (.xls)
    • 微軟 PowerPoint (.ppt)
    • 微軟 Word (.doc)
    • RTF (.rtf)
    • Flash (.swf)
    可以用這個選項選擇要限定或排除特定的檔案格式,Google 甚至可以把其中某些檔案格式即時轉換成 HTML 顯示成網頁。這個功能也可以在搜尋輸入框直接用「filetype:」接上副檔名來使用。
  • 日期。指定搜尋的日期範圍(多久以內更新的網頁或檔案):
    • 任何時間
    • 過去 24 小時內
    • 過去一週內
    • 過去一個月內
    • 過去 2 個月內
    • 過去 3 個月內
    • 過去 6 個月內
    • 過去一年內
  • 字詞位置。指定關鍵字要在網頁的哪個部分出現:
    • 任何位置。這就是平常搜尋的預設值。
    • 標題。指定關鍵字必須出現在網頁標題。這個選項也可以在搜尋輸入框直接用「intitle:」接上關鍵字詞;如果要指定所有的關鍵字詞都要出現在網頁標題的話,也可以用「allintitle:」。
    • 內文。指定關鍵字必須出現在網頁的實際內文中。這個選項也可以在搜尋輸入框直接用「intext:」接上關鍵字詞;如果要指定所有的關鍵字詞都要出現在網頁實際內文中的話,也可以用「allintext:」。
    • URL。指定關鍵字必須出現在網頁提到的網址之中。這個選項也可以在搜尋輸入框直接用「inurl:」接上關鍵字詞;如果要指定所有的關鍵字詞都要出現在網頁提到的網址中的話,也可以用「allinurl:」。
    • 在網頁的連結內。指定關鍵字必須出現在網頁內的定位錨之中。這個選項也可以在搜尋輸入框直接用「inanchor:」接上關鍵字詞;如果要指定所有的關鍵字詞都要出現在網頁內的定位錨的話,也可以用「allinanchor:」。
  • 網域。指定祇要在哪些網域之中搜尋,或者是要排除哪些網域。這個功能也可以在搜尋輸入框直接用「site:」接上指定的網域。這個功能可以做為任何網站的「站內搜尋」之用。
  • 使用權。指定要針對採用某些創用 CC 授權的網頁內容來搜尋:
    • 不依授權來搜尋。不做任何限制,這也是預設值。
    • 可任意使用或分享。搜尋採用創用 CC 「姓名標示」、「姓名標示─非商業性」、「姓名標示─非商業性─禁止改作」、「姓名標示─非商業性─相同方式分享」、「姓名標示─禁止改作」、「姓名標示─相同方式分享」授權釋出的內容。
    • 即使是商業用途,亦可任意使用或分享。搜尋採用創用 CC 「姓名標示」、「姓名標示─禁止改作」、「姓名標示─相同方式分享」授權釋出的內容。
    • 可任意使用、分享或修改。搜尋採用創用 CC 「姓名標示」、「姓名標示─非商業性」、「姓名標示─非商業性─相同方式分享」、「姓名標示─相同方式分享」授權釋出的內容。
    • 即使是商業用途,亦可任意使用、分享或修改。搜尋採用創用 CC 「姓名標示」、「姓名標示─相同方式分享」授權釋出的內容。
  • SafeSearch。選擇是否要用「安全搜尋」的功能,將成人情色內容濾掉不顯示。
  • 類似網頁。搜尋與指定網址內容相似的網頁。這個功能也可以在搜尋輸入框直接用「related:」接上指定網址。
  • 連結。搜尋有連到指定網址的網頁。這個功能也可以在搜尋輸入框直接用「link:」接上指定網址。

其他功能

除了上述的進階搜尋選項外,Google 搜尋還有一些額外的功能:

頁面快取

Google 會將網頁內容「快取」下來暫存,除了可以在搜尋結果清單中按「頁面快取」的鏈結外,也可以在搜尋輸入框直接用「cache:」接上指定網址來取用快取中的網頁。

網頁資訊

在搜尋輸入框直接用「info:」接上指定網址,就可以得到該網址的各項相關資訊,包括頁面快取、類似網頁、逆向連結等。

名詞定義

在搜尋輸入框直接用「define:」接上指定關鍵字,就可以查詢該關鍵字在各大字典、百科之中的定義。

翻譯

在台灣版的 Google 搜尋輸入框直接用:「翻譯」、「fy」或「FY」(後兩者為「翻譯」的拼音的縮寫)空格後接上要翻譯的英文單字,則可以查詢其中文翻譯;反之若接上中文,則可以查詢其英文翻譯。

曆法轉換查詢

在台灣版的 Google 搜尋輸入框中直接輸入指定曆法的指定日期資訊,則可以查詢相關的曆法轉換資訊。可用的曆法關鍵字包括了:

  • 公曆
  • 國曆
  • 農曆
  • 陽曆
  • 陰曆

另外也可以使用拼音的縮寫,例如「gl」、「nl」等。指定曆法之後可以接上:

  • 日期
  • 節氣名稱
  • 節日名稱

並可以指定年份,或者用「今年」、「去年」、「明年」等關鍵字;如不輸入年份,則會視為今年。

計算機

可以在搜尋輸入框直接輸入數學運算式,Google 會計算出結果。可以使用的運算符包括了:

  • 加「+」
  • 減「-」
  • 乘「*」
  • 除「/」
  • 乘冪(次方)「^」
  • 階乘「!」
  • 餘數「%」
  • 組合運算「選」或「choose」
  • 方根「開……次方」或「……th root of」
  • 百分比「%」或「% of」
  • 平方根「sqrt(……)」
  • 三角函數「sin(……)」、「cos(……)」、「tan(……)」、「cot(……)」、「sec(……)」、「csc(……)」
  • 以 10 為底的對數「log(……)」
  • 自然對數「ln(……)」
  • 優先運算「(……)」

計算的時候除了用十進制的數字外,也可以用:

  • 十六進制「0x……」
  • 八進制「0o……」
  • 二進制「0b……」
  • 科學記數「……e……」

此外 Google 還認得許多不同的常數,例如:

  • 「圓周率」、「pi」
  • 虛數「i」
  • 自然常數「e」
  • 「光速」、「c」、「the speed of light」
  • 「黃金分割率」、「phi」
  • 「普朗克常數」、「h」

單位換算

Google 可以做各種度量衡單位及匯率換算,祇要在搜尋輸入框中輸入一種單位及其數值,再輸入換算關鍵字,接著另一種單位,就能夠進行換算。換算關鍵字包括了:

  • 等於多少
  • =?
  • 表示成
  • ->
  • 換成
  • 是幾

至於單位及幣別,則可以任意使用中文、英文、縮寫等。因此可以做下列各種轉換及運算:

  • 3.5 USD =? GBP
  • 10港幣 -> 印尼盧比
  • 8台幣換成泰國的貨幣
  • 30 港幣每公升 =? 美元每加侖
  • 一磅=?克
  • 光速乘以二秒等於多少公里
  • 1 a.u./c
  • 1.21 GW / 88 mph
  • e^(i pi)+1
  • 1加侖等於多少升
  • 1市兩=?磅
  • 30度的正弦
  • G*(6e24 kg)/(4000 miles)^2
  • XVII 表示成中文
  • 地球半徑/月亮半徑
  • 恆河沙乘以不可思議減無量加大數除以阿僧祇等於多少
  • 天上一日
Author: Jedi