Cum se instalează NLTK?

Următorul articol Instalare NLTK oferă un contur pentru instalarea NLTK. NLTK este un set de biblioteci pentru prelucrarea limbajului natural. Este o platformă pentru construirea programelor Python pentru procesarea limbajului natural. NLTK este scris în limbajul de programare Python. A fost dezvoltat de Steven Bird și Edward Loper. Sprijină cercetarea și predarea în NLP sau în domenii strâns legate, inclusiv știința cognitivă, lingvistica empirică, regăsirea informațiilor, inteligența artificială și învățarea automată. NLTK oferă o interfață ușor de utilizat.

NLTK (Natural Language Toolkit)

  • Prelucrarea limbajului natural (PNL) este o parte a inteligenței artificiale care procesează limba vorbită de oameni. Astfel, ajută oamenii să interacționeze cu computerele chiar dacă nu au cunoștințe despre cum să-l folosească. Folosind NLP, oamenii trebuie doar să dicteze comanda computerelor. Odată cu puterea învățării de mașini, procesarea limbajului natural devine din ce în ce mai populară și mai ușor de implementat. Practic, este tehnica de a interacționa cu oamenii și de a efectua acțiuni pe comenzi vocale.
  • Aceasta permite dispozitivelor să fie folosite chiar de novice care nu are cunoștințe de tehnologie. Dar implementarea procesării limbajului natural nu este ușoară, deoarece o limbă vorbită de oameni nu are o structură certă. Este ambiguu și depinde de cuvinte de context care pot avea un sens diferit.
  • NLTK are peste 50 de corporale și surse lexicale, cum ar fi WordNet, Problem Report Corpus, Penn Treebank Corpus, etc. De asemenea, vine cu un ghid care explică conceptele procesării limbajului prin setul de instrumente și fundamentele de programare ale Python, ceea ce îl face ușor pentru oameni care nu au cunoștințe profunde despre programare. Are o gamă largă de pachete ceea ce îl face unul dintre seturile de instrumente puternice pentru NLP. Tokenization, Lemmatization, Stemming, Parsing, Număr caractere, Punctuație, număr de cuvinte sunt câteva dintre aceste pachete.

Instalați NLTK pentru Windows

Mai jos sunt instrucțiunile de instalare NLTK în Windows. Acestea se bazează pe presupunerea că Python nu este instalat în sistem. NLTK necesită versiuni Python 2.7, 3.5 și mai mari.

Pasul 1: Descărcați cea mai recentă versiune a Python pentru Windows din linkul de mai jos

https://www.python.org/downloads/

Pasul 2: Faceți clic pe descărcat .exe pentru a o rula.

Pasul 3: Selectați personalizarea instalării.

Pasul 4: Verificați toate caracteristicile, în special „pip”, deoarece ajută la instalarea NLTK și faceți clic pe Next.

Pasul 5: În ecranul următor, selectați opțiuni avansate, selectați calea și faceți clic pe Instalare.

Pasul 6: Odată ce instalarea are succes, aproape de fereastră.

Pasul 7: Copiați calea folderului Scripts pentru a instala NLTK în același folder.

NLTK poate fi instalat cu ușurință folosind un instalator „pip”. De asemenea, trebuie să instalăm și „numpy”.

Pasul 8: Pentru a instala NLTK, deschideți promptul de comandă și tastați sub comanda.

Asigurați-vă că instalarea are succes.

După instalarea de succes, a venit timpul să folosească NLTK pentru procesarea limbajului natural.

Pasul 9: Deschideți Python Shell și tastați mai jos comanda.

Dacă este importat fără nicio eroare, înseamnă că NLTK este instalat corect.

Instalați NLTK pentru Mac / Linux

Spre deosebire de Windows, sistemele Linux vin cu Python instalat în el. Pentru a instala NLTK în Linux / Mac, se utilizează instalatorul de pachete Python's Pip. Pentru a instala pip-ul sau a-l actualiza, tastați mai jos comenzile din promptul de comandă.

Pentru a instala python în Linux, utilizați comenzile de mai jos.

Pasul 1: Pentru a actualiza indexul pachetului folosiți comanda de mai jos.

Pasul 2: Pentru a instala Python în sistemul Linux, folosiți mai jos.

Pasul 3: Introduceți comanda de mai jos pentru a instala „pip” pentru Python 3.

Pasul 4: După instalarea „Pip” cu succes, utilizați următoarele comenzi pentru a instala NLTK.

Set de date NLTK

NLTK are multe seturi de date disponibile pentru procesarea limbajului natural, de exemplu, WordNet, WikiCorpus, Gutenberg, Lexicon de opinie, Tweebank, etc. Aceste seturi de date sunt denumite corpora. Practic, setul de date NLTK conține un set de fișiere sau documente. Fiecare fișier / document conține o colecție de cuvinte, litere sau text într-o singură limbă. Astfel, un corpus este în principal biblioteci pentru înțelegerea / învățarea unei limbi. Are reguli de gramatică și structură a unei limbi.

După instalarea cu succes a NLTK, îl puteți importa și, de asemenea, descărca corpul său cu următoarea comandă.

Descărcătorul NLTK deschide o fereastră pentru a descărca seturile de date. Mărimea setului de date este mare, deci va dura timp. Pentru a testa dacă seturile de date sunt instalate corect, încercați să importați setul de date și să îl utilizați.

Procesarea NLTK

Există 5 procese principale de prelucrare a limbajului natural. Acestea sunt etapele implicate în procesarea oricărui text.

  1. Detectare EOS : Detectarea sfârșitului vorbirii împarte textul într-o colecție de propoziții semnificative. Împărțește textul lung în părți care au un anumit sens.
  2. Tokenization : Acest pas împarte propozițiile în jetoane. Jetoanele nu conțin doar cuvinte, dar includ și spații în alb, pauze de propoziție.
  3. Etichetare POS : POS înseamnă semn de vorbire. Aici, informațiile sunt atribuite jetonului. Această informație sugerează ce tip de vorbire este la fel de tensionat, verb, adjectiv, substantiv etc.
  4. Chunking : Chunking înseamnă colectarea textului bazată pe etichete.
  5. Extracție: extragerea este un proces continuu de parcurgere a bucăților și de etichetare a acestora ca entități numite precum oameni, locații, organizații etc.

Concluzie:

NLTK este utilizat pentru clasificarea textului, subtitrarea imaginilor, recunoașterea vorbirii, răspunsul la întrebări, modelarea limbajului, rezumarea documentelor și multe alte operațiuni. Există multe alte instrumente pentru procesarea limbajului natural. Dar NLTK are o gamă largă de biblioteci, ceea ce îl face unul dintre instrumentele puternice de procesare a limbajului natural. Este mai precis decât orice alt instrument, dar din cauza unui număr mare de biblioteci, este puțin lent. Deci, totul depinde de cerințele utilizatorului. Dacă utilizatorul dorește viteză, poate prefera și alte instrumente, dar va trebui să facă compromisuri cu exactitatea conținutului. Dar dacă precizia este o prioritate, atunci acestea ar trebui să meargă cu siguranță pentru NLTK.

Articole recomandate:

Acesta a fost un ghid pentru Instalarea NLTK. Aici discutăm conceptul de bază și diferiții pași pentru instalarea NLTK pe Windows și Linux \ Mac. De asemenea, puteți consulta următoarele articole pentru a afla mai multe-

  1. Instalați Kubernetes Dashboard
  2. Cum se instalează JDK
  3. Instalați Docker
  4. Cum se instalează Magento?
  5. Versiuni Magento | Caracteristici ale versiunilor Magento