https://szkolazpieklarodem.pl/
Kawałki rzeczownika lub NP-chunking to w zasadzie „podstawowe frazy rzeczownikowe”. Można powiedzieć, że są to wyrażenia płaskie, których głową jest rzeczownik. Kawałki rzeczownika można traktować jako rzeczownik ze słowami opisującymi rzeczownik.
Spróbujmy wziąć przykład i lepiej go zrozumieć.
Przykład 1:
doc = nlp(u”Boston Dynamics is gearing up to produce thousands of robot dogs”)
list(doc.noun_chunks)
Wyjście:
[Boston Dynamics, thousands, robot dogs]
Chociaż posiadanie kawałków rzeczownika w danym zdaniu bardzo pomaga, spaCy zapewnia inne atrybuty, które również mogą być pomocne. Spróbujmy zbadać niektóre z nich.
Przykład 2:
doc = nlp(u”Deep learning cracks the code of messenger RNAs and protein-coding
potential”)
for chunk in doc.noun_chunks:
print(chunk.text, chunk.root.text, chunk.root.dep_,
chunk.root.head.text)
Wyjście:
Jak widać z tej tabeli, otrzymujemy rzeczownik chunks i ich atrybuty. Poniższa tabela pomoże Ci zrozumieć każdą kolumnę.