https://szkolazpieklarodem.pl/
Format JSON danych, którego oczekuje Rasa NLU, ma obiekt najwyższego poziomu o nazwie rasa_nlu_data, z kluczami common_examples, Entity_synonyms i regex_features. Najważniejszym, z którym będziemy pracować, są przykłady wspólne. Poniżej znajduje się szkieletowa forma wyglądu naszych danych JSON:
{
“rasa_nlu_data”: {
“common_examples”: [],
“regex_features” : [],
“entity_synonyms”: []
}
}
Klucz common_examples w naszych danych JSON jest centralnym miejscem, które będzie używane do uczenia naszego modelu. Wszystkie nasze przykłady szkoleniowe będziemy dodawać w tablicy common_examples.
regex_features to narzędzie pomagające klasyfikatorowi intencji rozpoznawać jednostki lub intencje i poprawiać dokładność klasyfikacji intencji. Zacznijmy pisać nasz plik JSON. Nazwijmy to data.json.
- Utwórz folder o nazwie horoskop_bot.
- Zmień bieżący katalog roboczy na horoskop_bot.
- Uruchom notatnik Jupyter #jupyter notatnik.
- Utwórz nowy folder o nazwie dane.
- Kliknij folder danych i przejdź do „Plik tekstowy” w menu Nowy w
Notatnik Jupytera.
- Kliknij na nazwę utworzonego pliku i zmień nazwę na data.json i wpisz swoje intencje dla swoich chatbotów. W krokach 5 i 6 możesz swobodnie korzystać z ulubionych edytorów, takich jak Sublime, Notepad ++, PyCharm itp., Aby pracować z plikiem JSON. Oto jak wygląda mój plik data.json w folderze danych:
{
“rasa_nlu_data”: {
“common_examples”: [
{
“text”: “Hello”,
“intent”: “greeting”,
“entities”: []
},
{
“text”: “I want to know my Horoscope”,
“intent”: “get_horoscope”,
“entities”: []
},
{
“text”: “Can you please tell me my horoscope?”,
“intent”: “get_horoscope”,
“entities”: []
},
{
“text”: “Please subscribe me”,
“intent”: “subscription”
}
],
“regex_features”: [],
“entity_synonyms”: []
}
}
Jak widać, przygotowywanie tego ręcznie wygląda bardzo nieporadnie. Na pewno pamiętasz miłą i łatwą metodę, którą mieliśmy w Dialogflow. Sprawdźmy więc fajne i ciekawe narzędzie do tworzenia danych treningowych w formacie, jakiego oczekuje Rasa. Został stworzony przez Polgára Andrása i całkiem nieźle nadaje się do sprawdzania i modyfikowania istniejących danych, które przygotowaliśmy wcześniej. To narzędzie pozwala zaoszczędzić dużo czasu, jeśli pracujesz nad małym projektem, w którym musisz ręcznie tworzyć dane. Zawsze dobrze jest wizualizować dane w dowolnej tworzonej aplikacji, która jest całkowicie oparta na danych. Zatem po prostu zapisz wcześniej utworzony plik data.json, dopóki nie rozszerzymy gromadzenia danych lepszą metodą.