Są takie technologie, które wchodzą z buta w nasze codzienne życie i zmieniają je na dobre. Należą do nich technologie „fulltext search”. Chcę Ci dziś o nich opowiedzieć:-). Odcinek pół-techniczny. Dowiesz się czym są technologie takie jak Solr lub Elasticsearch. Zrozumiesz także dlaczego są tak bardzo istotne w naszym świecie!
Proszę, oceń ten odcinek i podaj go dalej;-).
Ja nazywam się Marek Czuma. Jestem inżynierem oraz instruktorem Big Data. Jestem również założycielem Riotech Data Factory i Akademii Big Data.
Kurs „Fundament Apache Solr”: https://kursy.riotechdatafactory.com/fundament-apache-solr/ oraz https://akademia-bigdata.pl/fundament-apache-solr/
Transkrypcja odcinka
[Transkrypcja automatyczna, mogą pojawić się błędy]
Cześć, witam Cię bardzo serdecznie w odcinku numer 18 Big Data po polsku. I dzisiaj zabieram Cię do wnętrza naszej branży. Przejdziemy się po jednej z ciekawszych technologii, właściwie jednym z ciekawszych rodzajów technologii, Big Datowych, do przechowania, przeszukiwania danych. I to jest taki rodzaj technologii, który odmienił życie nas wszystkich. Trochę już o tym mówiłem, natomiast dzisiaj powiem bardziej technicznie, ale nie przerażaj się. Oczywiście wszystko będzie po staremu, czyli mówimy normalnym ludzkim językiem. Chciałem Ci po prostu opowiedzieć o bardzo, bardzo, bardzo ciekawiej technologii. Mowa o technologii Full Text Search. Co to za technologia? Dlaczego odmieniła nasze życie? I jeżeli chcesz się wniósł zagłębić, od czego można zacząć, jak to wszystko działa? O tym właśnie dzisiaj. Zabraszam za to jeszcze. Cześć. Witam Cię w podkaście Big Data po polsku. Poznajemy tu wspólnie jak działa świat, który jak wiadomo zbudowany jest z danych i rządzony jest przez algorytm. Jesteś w dobrym miejscu. Jeśli interesują Cię technologię, biznes, społeczeństwo, lub pogłębianie swojego potencjału i to wszystko w kontekście danych. Ja nazywam się Marek Czuma, jestem założycielem Rioter Beta Factor. W filmie, która pomoże Ci zrozumieć Big Data, wymiaże technicznym i biznesowym. Nalejdę do kubka solidną w porcję swojej ulubionej kawy. Pakuj swoje rzeczy i rusza i ze mną w tą fascynującą przygodę. No dobrze. Chciałem cię zaprosić w małopodrusz. Bo bardzo chcę Ci pokazać, o czym są technologię Fulltex Search, ale chcę Ci pokazać to wszystko ze swojej perspektywy. Chciałbym dać Ci takie swoje indywidualne spojrzenie na te technologię. A to dlatego, że są one dla mnie czymś zupełnie innym, dużo bardziej niezwykłym i wyjątkowym, niż po prostu jakieś tam technologie do przechowywania i przeszukiwania danych. Dlatego pozwól Ci opojemci krótku historię. Moją historię mnie i zabierajcie w podróż poszukiwaniu swojej własnej ścieżki zawodowi, a może nawet życiowej? Ruszajmy. Być może już szczęściej ścieżki zna, że jeżeli słuchasz Big Data w opolsku jakiś czas, mówiłem o tym, jak ja zaczynałem. Natomiast dzisiaj tylko wycinek małe i zresztczególnym naciskiem na ten sam punkt styku między poprzednią branżą obecną, bo nie od zawsze jest Big Data, ale wróćmy do początków. Koncze studia, właściwie jestem jeszcze w trakcie studiów i zatrudniam się w branży aplikacji łybowych. I to jest dla mnie dość spory szogu. To jest moja pierwsza robota, taka komercyjna, w IT. Pierwszy raz programuje, żeby zarobić pieniądze. I pierwszy raz muszę nauczyć się tak na serio. Nie, na zaliczenie, tylko tak na serio. W praktyce, jak działają aplikacje łybowe? Co to za architektura? Jak tam się trzeba poruszać? Jakie są warstwy logiczne? I tak dalej i tak dalej. I jak to implementować? Oczywiście już w kodzie. I najpierw robię to w jednej technologii później przynoszę się do innej filmy, w innej technologii jeszcze. I z miesiąca na miesiąc zauważam, że to chyba nie to. Z miesiąca na miesiąc, może nawet z roku na rok, zauważam, że wchodzę w coraz większy dół. Widzę, że to, co robię niespełnie, mnie tak jak miałem nadzieję, że będzie mnie spełniać. I zaczynam się zastanawiać dlaczego. Ale przede wszystkim przychodzi takie podstawowe pytanie. W czym ja jestem dobry? W czym ja w ogóle jestem dobry? Najlepiej, w czym jestem najlepszy, czy w czym mogę być najlepszy. Ale w czym w ogóle jestem taki, że wiadomo, że tam ludzie z okolic, czy to z firmy, czy z jakichś innych branżowych okolic będą wiedzieli, że ok, z tym problemem czysto specyfiką mogę iść do mara. Bo on się na tym zna. Zaczęłam się na tym zastanawiać, bo zaczęło do mnie docierać, że bardzo, bardzo mocno potrzebuję mieć taką swoją przestrzeń, w której czuję się świetnie. Żeby po prostu znam tajniki, znam rzeczy, których nie znają współpracolicy, którzy mają normalny stasz. No więc zaczęłam szukać takiego punktu. Wiesz co? Dotarła do mnie odpowiedź. Odpowiedź mi się nie spodobała, dlatego że była bardzo prosta w ręczbanana i na pytanie, w czym jestem dobry, mogłem sobie odpowiedzieć po prostu krótko w niczym. I to znalazło swoje odzwielczenie w decyzjach firmy, w której wtedy byłem zatrudniony. Tak, bardzo w niczym nie byłem dobry, że musieli wymyślić dla mnie jeszcze dla takiego jednego mojego kolegi specjalny program naprawczy. Zrobili specjalnie dla mnie i jeszcze dla jednej osoby osobny projekt, który mogliśmy zacząć zupełnie od zera. On też miał być jakieś jakieś zastosowanie w firmie, więc chociaż tyle plus na tym jest podstawową jego zaletą, było to, że my mieliśmy się doprowadzić do stanu użyteczności po prostu. I kiedy to byli do mnie dotarło, kiedy zostało mi to oznajmione, oczywiście nie byłem zachwycony, trochę moja duma ucierpiała. No dobra, ucierpiała bardzo solidnie. Natomiast spojrzałem prawdziwą, czy zastanowiłem się, jak jest obecny stan tak na serio, a nie moich marzeniach, czy w tym, jak ja widzę siebie w swoich oczekiwaniach, tym jak powinienem wyglądać, jak myślę, że mógł może wyglądać tylko tak na serio. Stanąłem w prawdzie, zastanowiłem się, doszłem do miosku, że decyzja firmy jest totalnie uzasadniona, a co więcej byłem im wdzięczny, dlatego że nie był to na pewno jakiś cioz wymierzony we mnie po prostu chcieli, żeby mógł się rozwinąć. Dlatego do dzisiaj jestem za to wdzięczny. Ja program naprawczy, wziąłem sobie całkowicie do serca, całkowicie na serio do tego potrzebłem i jak już widziałem, że dla Częi w niczym nie jestem dobry, ale mogę zacząć trochę odnowa, to zacząłem się przekładać do każdej jednej rzeczy. Odrzuciłem część innych zajęć, którym się zajmowałem i postawiam na to. Muszę, jeżeli ktoś już we mnie interesuje, muszę stać się w dobry w tym, co robię. Ale tutaj przyszło kolejne pytanie, jak już zacząłem zauważyć, że ok po tygodniu dwóch trzech miesiącu pracy na tym dzień w dzień, wedle konkretnej, dużo bardziej metodycznego podejścia. Zaczynam stawać się coraz lepszy, widzę punkty, w których faktycznie mi wychodzi. To było miłe, to było fajne. I zacząłem się zastanawiać, już nie w czym jestem dobry, ale ok, skoro mogę kształtować, realnie swoją umiejętności, to w czym ja chcę być dobry. Czy to, co teraz robię jest super? Jeżeli tak to, jaki fragment dokładnie tego, co robię chciałbym poszerzać. I doszedłem to takich dwóch wniosków. Pierwsza rzecz, tak, te aplikacje łebowe, mogłem tam znaleźć coś dla siebie, ale druga rzecz, raczej nie nastałe. Jeżeli nie wiesz, jak wyglądała aplikacje łebowe, tworzenia aplikacje łebowych, to tak w skrócie powiem, że jest to branża, która jest bardzo mocno ustandalizowana. To znaczy tam dużo jest technologii, które robią za ciebie. I jeżeli nie robić jakieś, nie wiadomo jakich aplikacji, to zasadniczo polega to w dużej mierze. Oczywiście nie tylko. Trochę teraz banalizuję, ale w wielu miejscach, na tym polega, że muszę nauczyć się pewnych standardów, nauczyć się pewnych zwyczajów. I jak powinno być napisane to w takim kontekście, albo w takim kontekście, jak powinienem zrobić to w tym frameworku, albo w tym frameworku. I tak powinienem po prostu pisać. Tam nie ma miejsca i to jest to, co do mnie dotarło bardzo mocno. Tam nie ma miejsca na to programowanie, które mnie od zawsze kręciło już od liceum, być może nawet od gimnazjum, czyli programowanie, gdzie ja mogę skupić się na logicę, programowanie, gdzie ja mogę stworzyć swój mechanizm działania, programowanie, gdzie mogę się wyszaleć tak twórczo. To było coś, co było dla mnie zawsze najważniejsze w programowaniu. Mogę być twórcą czegoś, mogę mieć swoją przestrzeń do inwencji, do inicjatywy, mogę się zastanowić, jak poprawić różne rzeczy i to nie poprawić w jakimś datalut, tylko naprawdę mogę coś napisać inaczej. Mogę popracować z danymi, z algorytmami, tylko wszystkiego mi tutaj brakowało. Chyba, że nie wiem, taką nam miastkę, że mogłem pracować albo na frontęcie, albo na bekęcie. Takie zgrubne ogólnie podziału jest w aplikacjach łobowych, mówiąc bardzo prosto i znów, trochę chyba naizując sorry, mojej koledzy, rzanki, randży, łobowej. No to aplikacja dzieli się na bekę, i frontend, to jest to co działa, jak to działa, a frontend to, jak to wygląda. I będąc frontendowcy, bo oczywiście trzeba mieć dużo różnych umiejętności, ale jest to raczej skupione dużo mocniej, no tym jak widzimy te wszystkie ikonki, jak te wszystkie popapy, które nam wyskakują, formularze i tak dalej. To jest coś i zauważyłem to bardzo mocno w pewnym momencie, to jest coś, gdzie ja po prostu się nie czuję. To jest coś, w czym ja jestem okropny, w czym ja jestem benadziejny, bo to bo mnie nie ma górszego frontendowca ode mnie. I kiedy robiłem frontend, ja po prostu czułem drastyczny wypalenie, po prostu czułem jak z dnia na dzień przestaje mi się chcieć cokolwiek. To było bardzo dziwne, bo jednak jest to branża, w której lubię się dziedzieć, a jednak jeżeli przechodziłem z frontentu na bekęt, imiałem tam coś zrobić nawet według standardów, ale to mówić na bekędzie, to jednak leczują, że zaczynam odżywać. I pech chciał, że jednak sporo część to była prosta frontendowa praca, która mnie wtedy spotkała, wtedy może czutkę wcześniej. I kiedy miałem taki czas, że już coraz więcej tej frontendowej roboty w tym projektie, czy w kolejnym przychodziło, ja coraz bardziej nie wiedziałem, co ze sobą zrobić. Zauważyłem, że z tych 6-8 godzin pracy, czy iluś tam, ile wtedy pracowałem, pewnie przepracowałem realnie z 20% czasu. Cała resztat było miganie się od roboty, ślizganie się po powierzchni i próba zebrania się do czołkowiek, dlatego, że miałem roboty frontendową, to wszystko spowodowało, że odpowiedziałem sobie na pytanie, w czym chce być dobry, na pewno nie we frontędzie, ale też na pewno nie, to aplikacja chłobowych muszę znaleźć coś innego, tylko co? Przyskuję teraz wszystko za aplikacją mi łebowymi, takie miałem wtedy spojrzenie. Przyszedł taki moment, że do naszej aplikacji musieliśmy wdrożyć wyszukiwarkę, i żeby wdrożyć wyszukiwarkę, zostało mi zaproponowane, że mogę wykorzystać technologię Elastic Selcza. Elastic Selcza, co to jest nie słyszałem o tym wcześniej, albo słyszałem gdzieś tam w takich cool warach. Nie do końca wiedziałem, to jest wiedziałem, że to chyba jest coś ciekawe, więc bardzo chętnie się zgodziłem i zaczęłem czytać o co to chodzi. Jak się z tym opchodzić? Mógł się dzięki temu zbudować wyszukiwarkę. Ok, jakie to mi da przewagi nad tradycyjnym podejściem, takim związanym z bo to jest Elastic Selcza, to też jest baza danych, ale straszem z takim interfejsem, który pozwala mi wejść z dodatkowymi funkcjonalnościami, będę zaraz o tym mówił. I zacząłem tworzyć, zacząłem w tym programować, i nagle miałem efekt wow, nagle zobaczyłem, że ten świat idealnie uporządkowany, pisany wedle konkretnych standardów nie jest jedynym światem. Nagle mogłem stworzyć coś, co w ogóle wmogłem wykorzystać taki przykład ludźny struktury. Nie musiałem tworzyć w bazie danych struktury, które są bardzo, bardzo restrykcyjne, pracyzyjne, mogłem stworzyć struktury, gdzie wrzucałem każdego kolejny rekord do bazy danych, który ma trochę innych staut. To było dla mnie niesamowite objawienie, co prawda nie jest najlepszy standard dzisiaj, to widzę, ale wtedy samotorzy mogłem to zrobić, to było coś niesamowitego. Mniejsza standardizacja, efekt wow, kiedy zobaczyłem, jak mogę wejść, poznawać technologię, które zupełnie inne niż tełe bowe, które znam do tej pory. I zobaczyłem, że tu są dużo większe możliwości, że tu otwiera się świat, który był do tej pory dla mnie, kompletnie nieznany świat, w którym możliwości są nieograńczone. I te możliwości są dyktowane tym, co ja wymyślę, dlatego że technologia daje mi tak dużo w funkcjonalności, które mogłym nazwać magicznymi, że aż ciężko w to uwierzyć. To jest sama implementacja, nie jest bardzo trudna, co ciekawe. I to był dla mnie punkt kuminocyjny. O tej pory zauważyłem, że mogę robić coś innego, mogę robić coś ciekawe, mogę robić coś zupełnie innym języku programowania niż do tej pory, który mnie jest coraz bardziej denerwował. Tak zacząłem poznawać świat drzawy, świat skali, z którym jestem do dziś i w którym jest mi bardzo dobrze. I Elastix Selcz spowodował, że zacząłem wchodzić w zupełnie inny świat, poznawać, dowiadywać się też, co to jest big date, bo wcześniej słyszałem, że jest coś takiego, ale nie do końca z dawym słysłem, sprawę z tego, jak to działa. I zacząłem powolutku myślać, że być może mogłym to robić na pełen etap. I to był początek długiej drogi, mojej tak naprawdę big datejowej. Jeszcze wtedy nie podjąłem decyzji o przebranżowieniu się, ale to był już ten moment, w którym ja zdecydowałem, albo byłem bliski decyzji, ok chcę wejść w coś innego, chcę, żeby te technologie łobowe nie były całym moim życiem. I Elastix Selcz, to jest właśnie technologia full-tech Selcz. To jest właśnie technologia, która pozwala, no właśnie, odpowiedzmy sobie na co to jest za technologia. Powiem, że Elastix Selczu, ale to nie jest jedna technologia full-tech Selcz i one mają to samo zastosowanie. Wszystkie dwie, bo na rynku są dwa podstawowe. Dwie podstawowe technologie one pozwalają ci zbudować bardzo, bardzo zaowansowaną wyszukiwarkę. W ogóle i sobie, że chcesz tworzyć bloga kulinarnego i jak to blog kulinarny ma przepisy, masz ich bardzo dużo. I one składają się nie tylko z bardzo jasnych, klarownych danych, takich jak cena produktów, które musisz kupić, czas pieczenia, czy nazwa, albo jakaś kategoria. To są takie proste dane, które zwykle upakujemy w standardowej, klasycznej basie danych. Natomiast jeżeli chcielibyśmy zbudować bloga kulinarnego, to te przepisy mają przede wszystkim bardzo dużo. I to małów, który znowu zbudował tekszu, załówasz podstawowa rzecz, opis, jakieś opinie najpierw dotyczące tego jak to wyjdzie, jak już zrobisz, jak będzie smaczny. Potem krok po kroku lista też składników, później krok po kroku jak to zrobić, dodatkowe uwagi jeszcze. To wszystko sprawia, że taki przepis, jeden przepis jest naprawdę bogatym zbiorem informacji głównie tekstowych. Jeżeli chcielibyśmy teraz zrobić na tym blogu Wyszukiwarkę, to wyobraź sobie, że chcesz wyszukać na przykład, no co byś chciał, albo chciała pomyślać sobie, masz kilka sekund na zastanowienie. Ja w tym momencie chciałbym zjeść coś wytrawnego i niech to będzie na przykład coś włoskiego, jakichś makaron. Makaron, napisałbym, makaron, węgataniańskie prosty wpisuje w Wyszukiwarkę i co wyskakuje mi 15 różnych przepisów. Jakie to mogło być przepisy? No najczęściej tak jakbyśmy wpisają w Google, coś z tyłu. Makaron z cukinią bardzo proste do zrobienia albo węgataniańska pasta ultra szybkie. Coś z tyłu. Rzeczy, które bardzo do nas pasują, dają nam to, co my chcemy. Dają nam te przepisy, które oczykiwaliśmy, bo wpisajśmy makaron węgataniańskiej prosty albo szybki. Chcemy dokładnie tego. Chcemy makaron z cukini, chcemy makaron ze szpinakiem, bez mięsa. Chcemy żeby robią się go szybko, bo żeby był prosty albo poniżej 10 minut. I zauważ, to jest to, co ty dostajesz, ale to nie jest dokładnie to, co ty wpisałeś czy wpisałeś. Bo jeżeli chcielibyśmy przeszukać ten zbiór dokładnie po tych słowach, to prawdopodobnie nie znalić im byśmy ani jednego przepisu, bo prawdopodobnie żaden przepis nie jest opisany dokładnie tak. Czyli gdybyśmy zrobili taką prostą wyszukiwarkę, najprostszą na świecie i chcieli tam znaleźć ten tą wrazę, to musiałoby być np. tytuł, który jest dokładnie taki sam makaron węgataniańskiej prosty. Jeżeli by to nie było, to nie zostało by to wyświetlone podczas wyszukiwania. Natomiast wyszukiwarki fulltex sercz, to zrób technologii fulltex sercz pozwalą zbudować takie wyszukiwarki, które nowołaśnie przeszukają cały tekst, bo to jest wyszukiwanie pełno tekstowe, przeszukają cały tekst i znajdują tam takie odpowiednie frazy w tak zaawansowany sposób, żeby jak najlepiej dopasować do twoich potrzeb. Dzięki temu to zrobić, dzięki temu, że posiadają bardzo dużo różnych funkcjonalności w budowanych już w siebie. Co to są za funkcjonalności? No właśnie, ta najprostsza, u której już powiedziałem, czyli nie szukamy np. mamy, co mamy tytuł, ale mamy też ten opis, mamy istę składników. Możemy załóżmy przeszukować potytule i po opisie. I jeżeli nasza fraza jest gdziekolwiek w tytule lub w opisie, to to już będzie się kwalifikowało. I może być tak, że dwa przepisy zostaną zebrane z tej bazy danych naszej, ale jeden będzie nadawał się bardziej, bo na przykład na przykład i w opisie kilka razy padał te różne frazy i w tytule pada część z tej frazy. W jednym przepisie, w drugim, natomiast w tytule w pada część z tej frazy, ale w opisie tylko raz. Na przykład tego typu słowa się znajdują i on też zostanie, jeden przepis zostanie wyszukany i drugi, ale one mają inną siłę inaczej powinny nam zostać przedstawione. Tak, w Google czy w innej wyszukiwacie, ten pierwszy, który jest zdecydowanie lepiej do nas dopasowany, bo ma więcej razy dów razy, będzie wyżej w historii wyszukiwania. Dokładnie taką funkcjonalność mają technologie full text search, czyli one nie tylko wyszukują czy jakiś przepis może nam się nadawać, ale one też tworzą coś, co jest nazwane skorringiem, czyli taką punktacją, jak te konkretne wyszukania, znaczy jak te konkretne dokumenty, bo tak się nazywają te rekordy w tej bazie danych, czyli w tym naszym konkretnym przykładzie, jeden przepis to jest jeden dokument w bazie, to jak te dokumenty w ramach konkretnego przeszukiwania są spriorytetyzowane, jaka mają punktację, które z nich do nas bardziej pasuje. W konkretnie w kontekście tego konkretnego wyszukiwania. My nie musimy o nic martwić, po prostu używamy tych technologii full text search, zastosowujemy je do naszych rozbiolu danych i budujemy wyszukiwarka z wykorzystaniem tego interfejsu, który daje nam dana technologia i ona po prostu sama utworzy ten skorring. Cięki czemu my możemy stworzyć świetną wyszukiwarkę na stronę nie męcząc się zbytnio. Tak nisko poziomowo nie musimy programować, nie wiadomo jak nisko poziomowo, żeby zrobić zaawansowaną wyszukiwarkę. Jakie inne funkcjonalności możemy mieć oprócz tej najbardziej podstawowej, że przeszukujemy nie cały tekst, nara zmusi się zgadzać tylko pojedyncze różne słowa wyszukiwia. Możemy np. zrobić coś, co nazywa się bardzo profesjonalnie proximity search, czyli sprawdzamy, czy ta dana fraza, którą wpisamy, jest da się ją stworzyć z tekstu, czy w tekście da się ją znaleźć w jakiejś konkretnej odległości. Już to macza ozrochodzi, bo to może wydawać się zawiłe. W obryach sobie, że jest napisane np. w tytule Makaron, Wegatariajski my chcemy znaleźć. Makaron Wegatariajski prosty i w tytule mamy coś takiego. Makaron bezmiensa w nawiasie Wegatariajski Ultra prosty, czy ta fraza, którą my wpisaliśmy, jest dokładnie tą? Nie jest. Czy dałoby się ją ułożyć z tych słów, dałoby się, tylko musieliśmy te słowa trochę poprzestawiać. Czyli zamiast prosty, Ultra prosty, musieliśmy to słówko prosty, trochę przesunąć w lewo, musieliśmy wywalić kilka słów, tam było błodajże. Bezmiensa i tak dalej i tak dalej. I każde takie przesunięcie to jest jeden krok w naszej odległości. Przestunąć się tak wszystkie wyrazy, żeby ułożyć naszą jedną wrazę. Możemy szukać takich dokumentów, które mogą mieć to w lewo, np. w odległości poniżej 10. Czyli poniżej 10 takich różnych przesunięć. Inna funkcjonalność możemy szukać konkretnych słów z konkretną odległością. To z kolei pozwoli nam na wyhaczenie literówek. Nie będę się zagłębiał oczywiście w algorytmy. Poza tym, że jak mamy jakieś słowo, to jeżeli zrobimy np. kamień, to słowo kamień będzie stało w odległości jeden od kamen. Czyli jeżeli wywalilibyśmy tą jedną literkę albo zamienili byśmy miejscami i literki, to będzie to słowo, który jest blisko tego docelowego. I my możemy zastosować bardzo taką funkcjonalność, która jednak bądź co będzie zdobywać za wasowana. A pozwala nam stworzyć funkcjonalność w wyszukiwania literówek. Bo jeżeli przeszuchujemy, chcemy coś wyszukać, nawet zobacz sobie, jak przeszukujesz w Google czy w innych wyszukiwań. Każdy internetowych, na pewno bardzo często robi literówki. I Google ci podpojada. Jaka fraza powinna być ta właściwa. Tam jest prawdopodobnie zastosowany podobny mechanizm. On widzi, że ta twoja twój wyraz niekoniecznie jest tym, który chce wyszukać. Natomiast jesteśmy w stanie to zignorować, jeżeli jest bardzo blisko jakiegoś innego wyrazu, który mógłby znaleźć. To są podstawowe funkcjonalności technologii full-tech search. Natomiast jest ich bardzo, bardzo dużo, że wspomnijmy jeszcze tylko np. synonimy, czyli możemy oklesić, że np. pizza i placek to są dwa blisko znaczne słowa. Więc jeżeli ja napiszę, najmniej na to wyszukałem sobie placek węgatoriański albo żeby zostawić ten węgatoriański, placek z dużą ilością sera, to jest w stanie wyszukać pizza serową, pizza 4 serę np. albo chcielibyśmy wyszukać w sklepie, jakieś ikaj, albo w naszych sklepach agatamy, bo już wychodzimy i chcemy wyszukać szafę i wpisujemy szafa duża blonsowa. I co? On wie, że szafa i komoda to są wyrazy blisko znaczne, że to są synonimy, więc on jest w stanie sobie to podstawić. I takich rzeczy jest bardzo, bardzo dużo. Mówię o tym technicznie jak takie rzeczy się robi, jak się implementuje w solarze konkretnie, jednej z dwóch technologii wiodących na YouTube. Bo pisałem też o tym na newsletterze i pisałem o tym na LinkedIn. Także zapraszam do tych miejsc, jeżeli masz jakichkolwiek głód, ale taki deikatny, żeby zobaczyć. To jeszcze bardziej w głęb, to tam tłumaczyłem bardzo serdecznie zapraszam. Natomiast takich funkcjonalności jest bardzo, bardzo dużo, nie będę tu wszystkich opisował. Jest ich na pęczki. Chciałem tylko zaresobać czym są te technologie fulltexselcz. Jak one się, czy one się wyróżniają i dlaczego ja wtedy programując aplikację Webohe miałem taki efekt wow. I już mam nadzieję, że rozumiesz, po prostu mogłem bardzo prostym, jednym znakiem, bo jakąś jedną wywołaniem funkcji mogłem doprowadzić do tego, że będzie mógł robić literówkę, a i tak znaleźć szukany dokument. Więc to było dla mnie super. Dlatego te technologie fulltexselcz są dla mnie takie wow, bo można zrobić coś, co jest już bezpośrednio dla użytkownika. Nie jest jak np. w moim ulubionym sparku, naprawdę kocham szczerze, ale jednak on jest daleko użytkownika. A technologie fulltexselcz pozwala je zrobić wyszukiwarkę. No właśnie przejdźmy do obiecanego punkty pod tytułem, dlaczego to jest tak bardzo istotne. Czemu te nasze wyszukiwarki fulltexselcz mogą już zmieniły nasze życie? Są ze że już wiesz, bo taką szczególną odmianą fulltexselczą są wyszukiwarki internetowe. Oczywiście tam jest dużo więcej niż tylko technologia fulltexselcz. Mówiłem o tym w jednym z odcinków, gdzie opisywałem w Big Data Polsku, w podkreście, gdzie opisywałem dlaczego moim zdaniem wyszukiwarkę internetowe akugretnie Google zmieniła w ogóle oblicze naszego myślenia naszej edukacji, czemu to jest jeden z najważniejszych wynalazków ludzkości. Zachęcam zelkiń do tego odcinka. Natomiast nie byłoby to możliwe, gdyby nie sama koncepcja fulltexselczu. I to kompletnie zmieniło nasze podejście. To właśnie chociażby do edukacji do wyszukiwania danych, naglestaliśmy się z społeczeństwem, które ma bardzo dobry dostęp do danych, bardzo szybki dostęp do informacji, nawet już nie do danych. Tylko do informacji możemy zdobyć ogrom wiedzy, przeszukać zbiory danych, które kiedyś się to nie śniło w ogóle władcą, żeby takie zbiory danych posiadać, a co dopiero je przeszukiwać z taką prędkością. My mamy to dzisiaj za darmo. Za darmo przynajmniej w kontekście finansowym. I to zmieniło nasze podejście do edukacji, do roli, jaką pełnić nauczyciel i do bardzo wielu innych rzeczy. Mówię dokładnie o tym w tamtym odcinku, natomiast to są zmiany, które są fundamentalne, zmieniły naszą cywilizację, nasze podejście do życia. I nie byłoby to możliwe, gdyby nie koncepcja full text serczu. I to jest jedna rzecz. Dlaczego są my słucham bardzo istotne? Bo pozwalają nam zdobywać wiedzę. Mam to na myśli wyszukiwarki, internetowe. Pozwalają nam bardzo szybko znaleźć konkretną informację, tak jak na przykład chociażby gdzie jest najbliższa picelia albo do której jest otwarta przychodnia. Natomiast pozwalają też zdobyć tu głębsza wiedzę, jak działa układ nim liczny na przykład albo dlaczego się nie wysypiam. I od razu mam mnóstwo materiałów, w których częściej jest naprawdę niezła. To jest pierwsza rzecz. Zdobywanie wiedzy, które dają nam technologię full text sercz, to jest druga rzecz, to jest zysk czasu. Bo możemy stworzyć wyszukiwarki już na stronach. Już nie mówię teraz o wyszukiwacy internetowej typu Google. Tylko mówię o wyszukiwacy na konkretnej stronie, na blogu, na sklepie, co jest bardzo ważne, gdzie możemy zyskać bardzo na czasie. Gdzie możemy zyskać na nerwach, bo się nie musimy frustrować, bo wyszukiwarka sama się do myśli wielu rzeczy. I możemy dzięki temu, że stosujemy zaawansowane, bardzo wyszukiwarki. Możemy sobie bardzo mocno ułatwić czas. Możemy szybko znaleźć produkt. W tym sposób mamy skleps 15 tys. produktów, z czego wiele z nich jest podobnych, jak się różnią, kolorem, rozmiarem i tak dalej, my możemy znaleźć to, co chcemy. I nie musimy ku temu przeczesywać wszystkich produktów. Zysk czasu jest ogromny. I to są takie dwie podstawowe rzeczy, które moim zdaniem są wystarczające, żeby uznać technologię full-tech set za jedne z najważniejszych bygdajtowych technologii, a może nie tylko bygdajtowych technologii w półczezności ich. Czyli zdobywanie wiecy dużo lepsze i dużo szybsze oraz zysk czasu w kontekście już bardziej konkretnych, witryn internetowych. Jakie słotechnologię słuchy tych sercz? Mamy z grubsza dwie. Oczywiście są jeszcze różnych murowe, natomiast one też bazują z grubsza na tych dwóch. Są też różne alternatywy, nie będę dzisiaj ich poluszał powiem od dwóch, które biorą żywcem prawie cały tort. I to solar i to jest elastik serczy. To są najpierw był solar. Najpierw był apaczy solar, który bazował i jest bazuje do dzisiaj, bo jest i dalej się rozwija na silniku, który nazywa się Lusin. I to jest silnik, który zapewnia bardzo dużo. Właściwie wszystko to, czym mówiłem, tylko na poziomie takim niskim, czyli to nie daje konkretnych już interfejsów, nie daje wykorzystania na poziomie architek tończnym, tylko udostępnia pewną nisko poziomową funkcjonalność. A solar bierze to Lusin i nakłada na nią swoją warstwę architek tończną, swoje jakiej dodatkowe funkcjonalności opakowuje to w struktury, on przechowuje dane i tak dalej i tak dalej. Natomiast pod spodem jest Lusin. I dokładnie to samo dzieje się z elastik serczym. Elastik serczyzny troszeczkę później i stał stanął w opozycji do solara. Elastik serczyzny niesamowicie ciekawa u technologią bardziej wydaje mi się zwinną elastyczną niż solar. Natomiast Elastik serczy też basuje na Lusin, czyli też basuje na tym samym silniku technologicznym. I nakłada na to swoją architekturę, swoje wadzcy komunikacji z programistą albo w ogóle z jakimś tam inżynerem, nie tylko z programistą. Czyli te dwie technologie zasadniczo jak poznajemy i to też jest fajne, że możemy się m.in. dość sprawnie przerzucać, bo one nie mają jakieś zupełnie innej koncepcji. One basują na tej samej koncepcji. Natomiast wygląda ją trochę inaczej o czymś, że trzeba się ich nauczyć, trzeba nad wpuświęcić dużo czasu, ale jednak basują na tej samej koncepcji i to jest dobra wiadomość. Natomiast jaka jest zła wiadomość? No nie, nie, mi czy taka zła. Ale załóżmy zła wiadomość jest taka, że trzeba się tego konkretnie połóczyć. Szczególnie simowa osola, że bo to jest technologia, która jest, ja ją zgłębiałem od początku roku bardzo, bardzo głęboko, bardzo poważnie na poziomie zaawansowanym, bo prowadziłem szkolenie solara. I dlatego też później opisywałem dużo i do teraz jeszcze są wideo, na YouTube będą wideo, będę pisował w nim w slaterze, więc solar teraz jest tutaj na tapecie, jeszcze przez kilka tygodni. I solar jest bardzo nietypową, ciekawą technologią, chociażby z tego powodu, że ma nietypową architektura. O, też obawiałem, nie będę tutaj się w to zagłębiał jako, że to nie jest podcast bardzo tak i techniczny. Natomiast powiem tylko, że większość technologii big data, technologii, które pracują w tribuie rozploszonym, to jest, to są technologii, które basują nas architekturze master slave. Czy jeden server nadzoruje inne maszyny, które rozdzielało, gdzie jest rozdzielana praca? Solar basuje na inne architekturze i samo to jest ciekawe, natomiast również to, że nie możemy tam np. stworzyć sobie tabel od tak po prostu. Musimy najpierw wykonać kawał takiej konfiguracyjnej pracy, nisko poziomowej, powiedzieliśmy, serverowej, no konfiguracyjnej, żeby móc dopiero wyśwłać to tam do tego całego ekosystemu solarowego na cluster i wtedy dopiero możemy taką tabelę, która tam się nazywa kolekcją, kolekcję dokumentów możemy wtedy stworzyć. Natomiast musimy stworzyć naprawdę zbudować dojść zaawansowaną konfigurację wcześniej, żeby chociażby określić schemat tej kolekcji, czyli jakie mamy mieć pola, czy tam ma być tytuł, czy ma być jakieś pole duże tekstowe, czy my obejrzeć jakieś pola liczbowe itd. Tam nie ma nawet te kładwo typów dostępnych, nie możemy nawet już tworząc tą konfigurację kolekcji, sami musimy stworzyć typy. No więc takich rzeczy jest bardzo dużo i co gorsza, chociaż w przypadku elastikselczat ten prógłejście jest dużo, dużo niższy, no to w przypadku solarę po prostu trzeba poznać całość, nie można także poznamy jakichś małe kawałek i już ruszymy, niestety trzeba to poznawać krok po kroku, ale jednak co, jakąś tam całość. Więc jest sporo szczegółów, które trzeba ogarnąć, zanim ruszymy już do konkretnego projektu dużego. I jest co zgłębiać, to znaczy technologia fulltechselcz naprawdę można zgłębiać dość długo, to nie są zwykłe bazy danych dodatkowo mająte funkcjonalności, także można naprawdę sporo się tutaj nakminić. Tym bardziej, że elastikselcz jeszcze ma dodatkowe technologie, które są spjęte z nim w ramach takiego ekosystemu. To jest kibana, to jest lockstash i to są technologie, które pomagają w no takim ogarnięciu całego ekosystemu. Kibana to jest aplikacja analityczna, która bazuje na danych solarach i dzięki czemu możemy zbudować naprawdę niesamowite dashboardy, analityczne, interaktywne, całem mapy, wykresyj itd., na danych solarach. Lockstash z kolei pozwala spierać logii z servera, logii z różnych aplikacji i ładować je do salara w takim zautomatyzowanym trybie, także to jest cały ekosystem, który też trzeba trochę poświęcić, żeby to ogarnąć. I to nie wiem, czy to jest złańt formacja, bo nauka uczenie się jest jednak fajne i fajnie, że możemy coś poznać od AdoZ. Dlaczego na przykład w przypadku solara nie jest to proste, bo tych technologii nie jest aż tak dużo. Natomiast tutaj jest bardzo dobra informacja, którą chciałem się z to podzielić, bo pisałem już o tym na niestratherze i na YouTube też tym mówiłem, zdecydowałem się, że dla tych, którzy chcieliby poznać solara przygotuję kurs, przygotuję kurs od AdoZ bardzo kompleksowo pokażę podstawy, ale takie, które wystarczy już do wyjścia w projekt. Pomyślałem dlatego, że nie jest naprawdę nie dużo materiałów w sieci dotyczących solara. Nie rozumiem tego trochę, dlatego że to jest dojściała technologia, to jest dobra technologia i jednak tych materiałów nie jest wcale tak dużo. Dlatego ja pomyślałem zamiast tworzyć, bo może nie zamiast, ale opok tworzenia takich krótkich treści, gdzie pokazuje jak konkretną funkcjonalność wdrożyć, jak sobie z czymś poradzić. Zróbmy kompleksowy kurs, tak żeby ktoś kto nie wienic o solarze mógłby wyjść z tego gotowym do wyjścia w projekt. Oczywiście będzie wyznał podstawy, ale to będą podstawy, które pozna, które są bardzo solidne, także zakońcimy nawet tak jak w przypadku wundamentu usparka, tak tutaj też zakończymy przygotowaniem do rozmowy rekrutacyjnej i ktoś w tym dostanie certyfikat będzie miał też na koncie swój piel w szyprojek, już zrobiony na gitchabie gdzieś tam w portfolio, którym będzie mógł się podczas rozmowy rekrutacyjnej pochwalić. I takie jest moje założenie, chcę żeby ten kurs był ekstremalnie wartościowy, chcę żeby ten kurs dawał każdemu kto chce, każdemu kto ma trochę czasu i ma chęci żeby się wysiedzieć, żeby dawał takie kompleksowe podstawy, bo ja uważam, że fundament, który zbudujemy, jeżeli jest solidnie wydany, to potem jest świetnym busterem do dalszej drogi. Ja chcę tajdu buster dać każdemu kto ma zapął. I będzie to pierwszych bastego, jeżeli się mylę, to daj znać, to będzie pierwszy kurs o solarze po polsku. I to jest też jego niewątpliwa zaleta, czyli trzy podstawy wartości metodyczne ułożenie krok po kroku, jeszcze w fajne atmosferze, także będzie to sprojął w ride, pierwszy kurs o solarze. To jest kurs, który przygotowuje już do wejścia w projekt, przygotowy je do rozmowy, klucyjny. I nie wiem jeszcze kiedy to opublikuję, bo dopiero to zacząłem budować. Natomiast już można zapisać się na listę oczekujących, jeżeli chcesz to zapraszamy, to jest newsletter, ale nie będziesz w tym narazie na stawać maili, w momencie takie ciche newsletter. I on zacznie być mniej ciche w momencie, w którym ogłoszę premiera. I jego ogłoszę najpierw właśnie na tym niustraterze. Ty się o tym dowie, że jeżeli się zapiszesz, pierwsz, ogłopierwsza. I to będzie podstawowa zaleta. Nie ominię cię start, a start jest bardzo ważnym punktem, po pierwsze dlatego, że masz parę tygodni tylko, żeby kupić kilka tygodni. Po tym czasie zwijam, to będzie pierwszy edycja i druga też będzie gdzieś tam za kilka miesięcy, kilkanaście może miesięcy. Już taka poprawiona, oczywiście każdy kto kupi, pierwszą ma też dostęp do drugiej. Natomiast druga zaleta, przygorz, że dowież się o tej premierze na samym początku, jeżeli nie ominię cię jej start, jest taka, że w dniu premiery na pewno będzie tani. Cena w przed pierwszy dzień może dwa dni będzie tansza niż później, a dodatkowo ty jako ktoś, kto jest członkiem tego niustletera, dostaniesz jeszcze rabat, czyli zazowniczo złoży się to w absurdalnie niskocenę całego kursu, jeżeli ucedujesz ten pierwszy moment. No i dlaczego tak? Dlatego, że każdy ktoś się zapiszę na tego typu niustleter, nie zobowiązują co zupełnie, możesz się zapisać nic tym nie zrobić, ale jest to jednak dla mnie jakieś potwierdzenie mniej więcej, jakie może być zainteresowanie, czego ja się mogę spodziewać. Ja mega doceniem, jeżeli coś takiego dla mnie robisz, dlatego chcę ci się odwzięczyć. To jest dla mnie bardzo duża pomoc. Ja bazuję od początku buduję naszą społeczność właśnie w takim kierunku, tymi pomagasz, ja ci pomagam, razem idziemy do przodu. A dodatkowo ostatnie tydzień przed premierą będę wysywał codziennie takie tips and tricks, takie moje przemyślenia dotyczące tego jak można z solarem pracować, żeby było przyjemniej lepiej. Także jeżeli jesteś chętny, chętna, to w opisie do tego podcastu, do tego odcinka masz wszystko. Pisałem, gdzie ten niustleter można dostać. No dobrze, to co, chyba powodniej kończymy, wydaje mi się, że opisałem ci mniej więcej, czym są technologię full text sales, dlaczego są takie stodne i co można z nimi zrobić fajnego. Chodziesz tylko, znaliśmy delikatnie tematu, daj znać, czyć temat podoba, można go rozwijać i rozwijać. Także ja na dzisiaj już kończę, dziękuję ci za wspólnie spędzony chwilę. Rzeczy ci wszystkiego dobrego, jeżeli masz tylko ochotę poznać świat full text sercza, to zapraszam na kurs fundament Apache Solr. A teraz wszystkiego dobrego trzymaj się miłego dnia. Cześć!
Dodaj komentarz