Chatbot z Pytonem : Tworzenie danych dla modelu w formacie JSON

https://szkolazpieklarodem.pl/

Format JSON danych, którego oczekuje Rasa NLU, ma obiekt najwyższego poziomu o nazwie rasa_nlu_data, z kluczami common_examples, Entity_synonyms i regex_features. Najważniejszym, z którym będziemy pracować, są przykłady wspólne. Poniżej znajduje się szkieletowa forma wyglądu naszych danych JSON:

{

“rasa_nlu_data”: {

“common_examples”: [],

“regex_features” : [],

“entity_synonyms”: []

}

}

Klucz common_examples w naszych danych JSON jest centralnym miejscem, które będzie używane do uczenia naszego modelu. Wszystkie nasze przykłady szkoleniowe będziemy dodawać w tablicy common_examples.

regex_features to narzędzie pomagające klasyfikatorowi intencji rozpoznawać jednostki lub intencje i poprawiać dokładność klasyfikacji intencji. Zacznijmy pisać nasz plik JSON. Nazwijmy to data.json.

  1. Utwórz folder o nazwie horoskop_bot.
  2. Zmień bieżący katalog roboczy na horoskop_bot.
  3. Uruchom notatnik Jupyter #jupyter notatnik.
  4. Utwórz nowy folder o nazwie dane.
  5. Kliknij folder danych i przejdź do „Plik tekstowy” w menu Nowy w

Notatnik Jupytera.

  1. Kliknij na nazwę utworzonego pliku i zmień nazwę na data.json i wpisz swoje intencje dla swoich chatbotów. W krokach 5 i 6 możesz swobodnie korzystać z ulubionych edytorów, takich jak Sublime, Notepad ++, PyCharm itp., Aby pracować z plikiem JSON. Oto jak wygląda mój plik data.json w folderze danych:

{

“rasa_nlu_data”: {

“common_examples”: [

{

“text”: “Hello”,

“intent”: “greeting”,

“entities”: []

},

{

“text”: “I want to know my Horoscope”,

“intent”: “get_horoscope”,

“entities”: []

},

{

“text”: “Can you please tell me my horoscope?”,

“intent”: “get_horoscope”,

“entities”: []

},

{

“text”: “Please subscribe me”,

“intent”: “subscription”

}

],

“regex_features”: [],

“entity_synonyms”: []

}

}

Jak widać, przygotowywanie tego ręcznie wygląda bardzo nieporadnie. Na pewno pamiętasz miłą i łatwą metodę, którą mieliśmy w Dialogflow. Sprawdźmy więc fajne i ciekawe narzędzie do tworzenia danych treningowych w formacie, jakiego oczekuje Rasa. Został stworzony przez Polgára Andrása i całkiem nieźle nadaje się do sprawdzania i modyfikowania istniejących danych, które przygotowaliśmy wcześniej. To narzędzie pozwala zaoszczędzić dużo czasu, jeśli pracujesz nad małym projektem, w którym musisz ręcznie tworzyć dane. Zawsze dobrze jest wizualizować dane w dowolnej tworzonej aplikacji, która jest całkowicie oparta na danych. Zatem po prostu zapisz wcześniej utworzony plik data.json, dopóki nie rozszerzymy gromadzenia danych lepszą metodą.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *