poniedziałek, 30 września 2013

Spotkanie 4:Wyszukiwanie informacji.

Lekcja 4

Temat:Wyszukiwanie informacji.

1.Jak sprytnie ,,guglać'' ?
Wyszukanie pożądanej informacji wśród miliardów stron dostępnych w internecie od dawna nie jest już prostą sprawą, choć być może odnosisz zupełnie inne wrażenie. Gdy odwiedzasz wybrany serwis wyszukiwaczy , wpisujesz to, co przyjdzie Ci na myśl, i już po krótkiej chwili otrzymujesz wynik przeszukania przepastnej bazy danych serwisu, która niejednokrotnie zajmuje wiele twardych dysków wydajnych komputerów. Dokładny mechanizm analizowania Twojego zapytania jest bardzo skomplikowany i stanowi tajemnicę twórców wyszukiwarki. Co zrobić, by szybko trafić pod właściwy adres ?

Przede wszystkim .... 

  1. Każde słowo ma znaczenie.Zazwyczaj uwzględnione zostaną wszystkie wpisane przez ciebie słowa.
  2. Wielkość liter nigdy nie ma znaczenia.Zapytanie szczecin da te same wyniki co SZCZECIN.
  3. Znaki przestankowe oraz specjalne (@#$%^&*( )=+{ }/ i inne) są traktowane specjalnie lub są ignorowane. 
  • GOOGLE

  • plus + 

  • – wymuszenie włączenia wyrażenia. Wyrażenia poprzedzone znakiem plus zostają włączone 
  • do zapytania. Jest to przydatne, gdy chcemy włączyć wyrażenie standardowo pomijane 
  • przez wyszukiwarkę, np. Henryk +VII albo +The Police.
  • OR lub pionowa kreska | 

  • – operatory alternatywy. Np. dla wyrażenia pies | kot (równoważnie pies OR kot) zostaną wyszukane 
  • strony odpowiadające któremukolwiek ze słów: pies lub kot, a także zawierające oba te słowa. 
  • minus – 

  • – operator negacji, wykluczenia wyrażenia z zapytania. Minus musi poprzedzać wykluczone 
wyrażenie bez spacji, np. pociągi –rozkład.


nawiasy okrągłe ( )

– operator grupowania nieuporządkowanego. Wyszukiwanie wyrażeń zawierających podane słowa,
jeżeli ich kolejność nie ma znaczenia, np.
(Wrocław ZOO).

cudzysłów „ ”

– operator grupowania uporządkowanego. Wyszukiwanie
dokładnej nazwy lub ciągu słów
w określonej kolejności, np.
"Teatr Polski"
.

gwiazdka *

– operator zastępowania ciągu. Zastępuje ciąg znaków, np. wyrażenie
"dr * Kowalski"
pozwala
wyszukać
dr nauk med. Adam Kowalski
oraz
dr inż. Artur Kowalski.

kropka .

– operator zastępowania znaku.
Zastępuje pojedynczy znak, np. wyrażenie
gabriel. zapolsk.
pozwala
wyszukać
Gabriela Zapolska
oraz
Gabriel Zapolski.

tylda ~

– operator wyszukiwania synonimów.
Jeżeli któreś ze słów w wyszukiwanym wyrażeniu oznaczymy
tyldą, zostaną wyszukane wyrażenia zawierające zarówno dane słowo, jak i jego synonimy. Np.
wyrażenie
~darmowe ~oprogramowanie
pozwala wyszukać
Darmowe aplikacje
oraz
Bezpłatne
programy.

dwie kropki ..

– operator przedziału, zakresu.
Wyszukiwanie dowolnej liczby z przedziału, np.
lipiec 23..27

cache:

Wyświetlanie zapisanej przez Google kopii strony, n
p.
cache:pwr.wroc.pl.

define:

Wyszukiwanie definicji, np.
define:who.

filetype:

Wyszukiwanie plików o danym rozszerzeniu, np. wyrażenie
operatory filetype:pdf OR filetype:doc
wyszukuje słowo
operatory
w plikach pdf
lub
doc
zamieszczonych w sieci.

inanchor: oraz allinanchor:

Wyszukiwanie wyrażeń w tekście odnośników. Np.inanchor:operatory
wyszukuje strony, które
zawierają link pod słowem
operatory
. Wyrażenie allinanchor:operator przeciążanie
wyszukuje strony
zawierające wszystkie podane po dwukropku słowa w jednym linku do jakiejś strony.

info:

Wyszukiwanie informacji o stronie, np.
info:google.pl
.

intext: oraz allintext:

Wyszukiwanie wyrażeń w treści stron. Np. wyrażenie
chlor intext:tlen
znajdzie strony dla wyrażenia
chlor
, w których treści zawiera się dodatkowo słowo
tlen
. Wyrażenie allintext:tlenek dichloru
uwzględnia wszystkie podane po dwukropku słowa.

intitle: oraz allintitle:

Wyszukiwanie wyrażeń w tytułach stron. Np. wyrażenie
intitle:kalendarz
znajdzie strony, których
tytuł zawiera słowo
kalendarz. Wyrażenie
allintitle:kalendarz pwr
uwzględnia wszystkie podane po
dwukropku słowa.

inurl: oraz allinurl:

Wyszukiwanie wyrażeń w adresach stron. Np. wyrażenie 
inurl:libal inurl:pwr
znajdzie stronę
urszula.libal.staff.iiar.pwr.wroc.pl. Ten sam efekt osiągniemy za pomocą wyrażenia
allinurl:libal pwr,
które uwzględni wszystkie podane po dwukropku słowa.

link:

Wyszukiwanie stron linkujących do podanej strony, np.
link:pwr.wroc.pl.

movie:

Informacje o filmach, recenzje oraz repertuar kin,
np.
movie:Wrocław
wyszukuje aktualnie grane
filmy we wrocławskich kinach, a
movie:harry potter
wyszukuje recenzję filmu i godziny seansów.
Opcja ta różnie działa w zależności od ustawionej lokalizacji. 

related:

Wyszukiwanie stron tematycznie podobnych do podanej
strony, np.
related:pwr.wroc.pl
wyszukuje
strony innych polskich politechnik.

site:

Zawężenie listy wyników do podanej domeny, np.
wtyczki firefox site:mozilla.org. Może służyć także
do wykluczenia wyszukiwania wyników w danej domenie, np.
wtyczki firefox -site:mozilla.org.

weather

Wyszukiwanie pogody dla podanej lokalizacji, np.



Znak 2.Wynik/Sposób użycia
Dowolny znak Oznacza dowolny znak, chyba że określono inaczej.
. Oznacza dowolny znak za wyjątkiem znaku podziału wiersza lub akapitu. Na przykład wyszukiwanie frazy "kl.cz" powoduje znalezienie zarówno słowa "klucz" oraz "klacz".
^ Znajduje poszukiwaną frazę tylko wtedy, gdy występuje ona na początku akapitu. Występujące na początku akapitu specjalnie obiekty - takie jak puste pola lub ramki zakotwiczone do znaków - są ignorowane. Przykład: "^Piotr".
$ Znajduje poszukiwaną frazę tylko wtedy, gdy występuje ona na końcu akapitu. Występujące na końcu akapitu specjalnie obiekty - takie jak puste pola lub ramki zakotwiczone do znaków - są ignorowane. Przykład: "Piotr$". $ sam zgodny jest z końcem akapitu. W ten sposób możesz wyszukać i zastąpić podział akapitu.
* Znajduje zero lub więcej znaków występujących przed symbolem "*". Na przykład wyszukiwanie frazy "Ab*c" powoduje znalezienie fraz "Ac", "Abc", "Abbc", "Abbbc" itd.
+ Znajduje jeden lub więcej znaków występujących przed symbolem "+". Na przykład wyszukiwanie frazy "AX.+4" powoduje znalezienie "AXx4" ale nie "AX4". Zawsze znajdowany jest najdłuższy możliwy ciąg znaków pasujący do wzorca w akapicie. Jeśli akapit zawiera ciąg "AX 4 AX4", podświetlany jest cały akapit.
 ? Znajduje zero lub jeden znak występujący przed symbolem "?". Na przykład wyszukiwanie frazy "Teksty?" powoduje znalezienie fraz "Tekst" i "Teksty", natomiast wyszukiwanie frazy "x(ab|c)?y" - fraz "xy", "xaby" i "xcy".
\ Podczas wyszukiwania znak specjalny występujący po znakach "\" jest interpretowany jak zwykły, a nie jak specjalny symbol wyrażenia regularnego (za wyjątkiem kombinacji \n, \t, \> oraz \<). Na przykład wyszukiwanie frazy "drzew\." powoduje znalezienie ciągu "drzew." a nie "drzewo" czy "drzewa".
\n Oznacza podział wiersza wstawiony kombinacją klawiszy Shift+Enter. Aby zastąpić podział wiersza podziałem akapitu, w polach Szukaj i Zamień na należy wpisać ciąg \n, a następnie wykonać wyszukiwanie i zamianę. \n w polu tekstowym Wyszukaj to znak podziału wiersza, który został wstawiony poprzez naciśnięcie kombinacji klawiszy Shift+Enter.
\n w polu tekstowym Zamień na to znak podziału akapitu, który można wprowadzić poprzez naciśnięcie klawisza Enter lub Return.
\t Oznacza znak tabulacji. To wyrażenie można także wpisać w polu Zamień na.
\b Dopasuje granicę słowa. Na przykład, "\bpan" znajdzie "pantofel", ale nie "tulipan", natomiast "pan\b" znajduje "tulipan" ale nie "pantofel". Samo słowo "pan" zostanie znalezione w obu przypadkach.
^$ Znajduje pusty akapit.
^. Znajduje pierwszy znak akapitu.
& lub $0 Dodaje łańcuch znaleziony zgodnie z kryteriami określonymi w polu Szukaj do frazy w polu Zamień na podczas zastępowania. Na przykład wprowadzenie frazy "rama" w polu Szukaj i frazy "anty&" w polu Zamień na powoduje zastąpienie słowa "rama" słowem "antyrama".
Symbol "&" można również wprowadzić w polu Zamień na. Pozwala to zmodyfikować Atrybuty lub Format ciągu znalezionego przez podane kryteria.
[abc123] Oznacza jeden ze znaków znajdujących się między nawiasami kwadratowymi.
[a-e] Oznacza dowolny ze znaków z przedziału od a do e, w tym znaki początkowe i końcowe Znaki są ustawiane w kolejności według numerów kodów.
[a-eh-x] Oznacza dowolny ze znaków z przedziałów od a do e oraz od h do x.
[^a-s] Oznacza dowolny ze znaków spoza przedziału od a do s.
\xXXXX Oznacza znak specjalny określony czterocyfrowym kodem szesnastkowym (XXXX). Kod specjalnego znaku zależy od zastosowanej czcionki. Kody można przejrzeć, wybierając Wstaw - Znak specjalny.
| Znajduje frazy występujące przed symbolem "|" i po nim. Na przykład wyszukanie frazy "to|tamto" powoduje znalezienie ciągów "to" i "tamto".
{2} Definiuje liczbę możliwych wystąpień znaku znajdującego się przed nawiasem otwierającym. Na przykład wyszukiwanie frazy "zo{2}" powoduje znalezienie ciągu "zoo".
{1,2} Definiuje maksymalną i minimalną liczbę możliwych wystąpień znaku znajdującego się przed nawiasem otwierającym. Na przykład wyszukiwanie frazy "zo{1,2}" powoduje znalezienie ciągów "zo" i "zoo".
{1,} Definiuje minimalną liczbę wystąpień znaku znajdującego się przed nawiasem otwierającym. Na przykład wyszukiwanie frazy "zo{2,}" powoduje znalezienie ciągów "zoo", "zooo" i "zooooo".
( ) W polu Wyszukaj: Definiuje znaki znajdujące się w nawiasach jako elementy, do których można się potem odwołać. Do pierwszej takiej grupy znaków można się odwołać wpisując "\1", do drugiej - wpisując "\2" i tak dalej.
Na przykład jeśli tekst zawiera liczbę 13487889, wyszukiwanie z użyciem wyrażenia regularnego "(8)7\1\1" powoduje znalezienie ciągu "8788".
Nawiasami () można także grupować ciągi, na przykład fraza "a(bc)?d" powoduje znalezienie "ad" lub "abcd".
W polu Zamień na:
Aby zamienić odwołania, użyj symbolu $ (dolar) zamiast symbolu \ (odwrotny ukośnik). Aby zamienić cały odnaleziony ciąg, użyj symbolu $0.
[:alpha:] Oznacza znak alfabetyczny. Aby znaleźć taki znak należy użyć wzorca [:alpha:]+.
[:digit:] Oznacza cyfrę dziesiętną. Aby znaleźć taki znak należy użyć wzorca [:digit:]+.
[:alnum:] Oznacza znak alfanumeryczny ([:alpha:] i [:digit:]).
[:space:] Przedstawia znak spacji (ale żaden inny znak specjalny).
[:print:] Oznacza znak drukowalny.
[:cntrl:] Oznacza znak niedrukowalny.
[:lower:] Oznacza małą literę, o ile w sekcji Opcje zaznaczono pole wyboru Uwzględniaj wielkość liter.
[:upper:] Oznacza wielką literę, o ile w sekcji Opcje zaznaczono pole Uwzględniaj wielkość liter.

Katalog stron WWW – jeden z rodzajów organizacji adresów i kategoryzacji stron internetowych. Moderowane ręcznie zbiory adresów internetowych, grupowane tematycznie.
W katalogach autorzy stron lub inne osoby zgłaszają stronę, zazwyczaj z krótkim opisem, po czym zostaje ona, zwykle po przejrzeniu, wpisana na listę pod danym hasłem.
Największym katalogiem jest DMOZ. Jest on tworzony przez ochotników z całego świata (kilkadziesiąt tysięcy osób). Cała treść tego katalogu jest dostępna jako open content w pliku XML i można z niej korzystać w dowolnych celach, pod warunkiem, że umieści się link powrotny na stronę DMOZ.

http://www.google.pl/url?sa=t&rct=j&q=&esrc=s&source=web&cd=8&ved=0CGMQFjAH&url=http%3A%2F%2Fhelion.pl%2Fksiazki%2Fspisy%2Fipopog.htm&ei=3E5lUrLyHYTDhAe3soDYCQ&usg=AFQjCNEBFCzSFQzveXl4pEmSJC3NQHUoTw&sig2=IZv7L2-GkWAOM9zHWH7acg&bvm=bv.54934254,d.bGE

Brak komentarzy:

Prześlij komentarz