Promtologia - Dojo, 18.04.26

Podsumowanie

Pinecone Vector Database Setup

Zespół spotkał się, aby kontynuować naukę o bazach danych wektorowych, ze szczególnym uwzględnieniem Pinecone jako nowego narzędzia do budowania baz wiedzy zewnętrznych dla asystentów. Marek poprowadził grupę przez zakładanie kont Pinecone oraz konfigurację przepływu pracy w n8n, w tym łączenie modeli OpenAI i tworzenie indeksów baz danych. Zespół napotkał pewne problemy techniczne z poświadczeniami OpenAI i konfiguracją modelu, które Marek pomógł rozwiązać, dostarczając konkretnych instrukcji generowania i konfigurowania kluczy API. Sesję zakończyły instrukcje dotyczące tworzenia i konfiguracji indeksu w Pinecone, w tym wyboru odpowiednich modeli osadzania i dostawców chmury dla warstwy bezpłatnej.

Konfiguracja i instalacja Pinecon

Marek poprowadził dyskusję na temat konfiguracji Pinecona, koncentrując się na tworzeniu indeksu, przesyłaniu dokumentów oraz konfigurowaniu magazynu wektorowego do pobierania dokumentów. Zespół potwierdził konfigurację pustego indeksu i omówił znaczenie używania spójnych nazw dla indeksów i przestrzeni nazw. Skonfigurowali oni przepływ pracy w celu ładowania dokumentów i skonfigurowali agenta do pobierania dokumentów z bazy danych Pinecon, podkreślając potrzebę konkretnych modeli osadzania i aktualnych konfiguracji. Sesję zakończyły instrukcje dotyczące budowania pełnego przepływu pracy i zarządzania wieloma bazami danych w ramach Pinecon.

Konfiguracja dokumentu bazy wiedzy Knowledge Base

Marek poprowadził zespół przez proces tworzenia trzech dokumentów w systemie bazy wiedzy. Wyjaśnił, że muszą stworzyć dokumenty zawierające instrukcje, słownik reklamowy i słownik marketingowy, z których każdy zawiera konkretne definicje i pojęcia. Zespół potwierdził pobranie wszystkich trzech dokumentów, a Marek zademonstrował sposób ich wgrywania do systemu bazy wiedzy, w tym stworzenie nowej przestrzeni nazw dla słownika marketingowego.

Demonstracja konfiguracji systemu bazy danych

Marek zademonstrował konfigurację i zarządzanie systemem baz danych z wieloma typami dokumentów, w tym słownikami marketingowymi, reklamowymi i instrukcjami. Wyjaśnił proces tworzenia i organizowania różnych przestrzeni nazw i typów dokumentów w systemie. Dyskusja obejmowała przetestowanie funkcjonalności systemu oraz sprawdzenie, czy z bazy danych pobierane są prawidłowe definicje.

Dyskusja na temat konfiguracji Pinecone Agent

Marek wyjaśnił konfigurację agenta Pinecone, który wykorzystuje wiele szuflad z różnymi informacjami do udzielania odpowiedzi.

Demonstracja i planowanie systemu chatbotów

Marek zademonstrował system chatbotów, który może być podłączony do wielu baz danych, pozwalając na kontrolowane rozmowy w oparciu o dostępne dane. Pokazał, jak udostępnić chatbota publicznie za pośrednictwem linku produkcyjnego i monitorować jego wydajność poprzez dziennik realizacji. Marek zaproponował w następnej sesji stworzenie chatbotów dla stron internetowych każdego uczestnika, wymagających konfiguracji domeny oraz zasugerował eksplorację botów głosowych podczas przyszłych spotkań.

Spotkanie demonstracyjne funkcji Voicebot

Marek zademonstrował nową funkcję voicebota pokazując, jak może on obsługiwać zarówno zapytania głosowe, jak i tekstowe. Wyjaśnił, że system chatbota wykorzystuje bazę wiedzy, w której informacje można dodawać różnymi metodami, w tym za pomocą dokumentów, adresów URL i ręcznego wprowadzania tekstu.

Przegląd implementacji bazy danych wektorowych

Marek wyjaśnił koncepcję wektorowych baz danych i modeli osadzania, w tym sposób konwersji dokumentów na wektory i przechowywania ich w Pinecon. Opisał szczegółowo przepływ pracy obejmujący trzy przestrzenie nazw, pobieranie dokumentów i procesy pobierania wektorów. Marek podkreślił znaczenie spójnego nazewnictwa w różnych węzłach oraz podkreślił rolę rekurencyjnego rozdzielacza tekstu w utrzymaniu struktury dokumentu. Zapowiedział plany omówienia asystentów agentów i integracji chatbotów na kolejnej lekcji i obiecał udostępnić dodatkowe materiały, w tym slajdy i dokumenty, za pośrednictwem poczty elektronicznej.

Omówienie struktury bazy danych chatbotów

Marek wyjaśnił strukturę baz danych chatbotów, zauważając, że proste chatboty mogą obsługiwać duże pliki tekstowe podzielone na sekcje, podczas gdy bardziej złożone systemy wymagają różnych rodzajów szuflad dla różnych formatów dokumentów, takich jak pliki CSV. Omówił wyzwania związane z integracją baz danych pochodzących z różnych działów w firmach, gdzie każdy dział może stosować różne standardy opisywania kolumn danych. Marek poruszył także rolę algorytmów wyszukiwania w bazach wiedzy, wyjaśniając, że choć tradycyjne metody takie jak RAGU pozostają aktualne, są one tylko jednym z wielu możliwych podejść, przy czym metody hybrydowe często dają najlepsze wyniki w zależności od rodzaju wyszukiwanych dokumentów.