Udhëzues për Semalt në Zgjatjen Scraper për Chrome

Që çdo biznes të mbijetojë dhe të rritet përfundimisht, është e nevojshme të qëndroni përpara konkurrencës së tij dhe rreziqe të ndryshme. Marrja e vendimeve bazuar në të dhëna analitike është një mënyrë e sigurt për të harruar këto probleme. Të dhëna të tilla mund të merren përmes skrapimit të të dhënave. Këtu hyn shtrirja e lehtë për skrap për Chrome: jo vetëm që do të lehtësojë procesin e vjeljes së të dhënave, por gjithashtu do të bëjë të mundur që skrapimi të shkulet pa lëvizje të komplikuara.

Si të përdorni Scraper

    1. Gjëja e parë që duhet të bëni është të instaloni shtesën, kështu që drejtohuni tek dyqani në internet i kromit, kërkoni "scraper" dhe klikoni mbi shtimin në Chrome.

    2. Navigoni në faqen e internetit që keni ndërmend të fshini të dhënat nga, shënoni hyrjen për të cilën jeni të interesuar duke e theksuar atë. Klikoni me të djathtën mbi të dhe zgjidhni "scrape similar" në menunë që shfaqet.

    3. Duke vepruar kështu, do të nisë një dritare e veçantë e tastierës scraper. Këtu, do të shihni një listë të të dhënave të shkruara .

    4. Për të ruajtur përmbajtjen, klikoni në "ruani te Google Docs", kjo automatikisht do të eksportojë të dhënat në një spreadsheet Google.

Skrapim i zgjatur

Në rast se planifikoni të fshini më shumë të dhëna, mund të përdorni metodën e përparuar. Shënim, do të jetë shumë më e lehtë të punoni me mjetin nëse keni disa njohuri për HTML. Supozoni se keni dashur të fshini të dhënat nga një burim që ka një arkiv të bazuar në të dhënat e serive kohore. Në një rast të tillë, nëse provoni metodën e përshkruar më sipër, do të merrni të dhënat e plehrave.

Për të zgjidhur këtë çështje, mund të përdorni një gjuhë pyetjeje HTML dhe XML të njohur si XPath. Doesfarë bën? XPath njeh të dhëna në lidhje me elementët e ndryshëm që përmbahen në secilën përzgjedhje. Më poshtë është një udhëzues se si të merreni me të:

1. Shkoni në tastierën Scraper, në pjesën e sipërme të majtë ju duhet të vini re një buton "XPath", klikoni mbi të dhe vazhdoni të mblidhni tabelën fillestare.

2. Ju duhet të shkruani XPath për elementin e duhur. XPath aktual që përfshin të gjithë informacionin do të shfaqet në një format si ky "// div [3] / div [3] / div [2] / div". Elementet <div> do të njihen në dokumentin HTML nga kompjuteri.

3. Për të ndarë të dhënat e njohura, duhet të përdorni kolonat Scraper. Për ta bërë këtë, duhet të shikoni për llojet e ndryshme të informacionit që keni në dispozicion. Në varësi të të dhënave që ju skraponi, mund të keni tituj. Këto tituj janë të pranishëm pranë çdo grupi të të dhënave. Ato shoqërohen nga një etiketë, në këtë rast, një etiketë <b>.

4. Duke përdorur elementin e inspektimit të gjetur dhe shtoni etiketën <b> në XPath tuaj. Tani ju mund ta etiketoni këtë kolonë të parë si "kolonën e titullit" pasi do të rendisë titujt. Vazhdoni të krijoni XPaths të ndryshëm për secilën kolonë që ju nevojitet.

5. Klikoni në skrap dhe shtesa do të korrë automatikisht të dhënat dhe do t'i organizojë ato në kolonat e ndryshme që keni vendosur.