• Historia uczenia głębokiego w pigułce

    Uczenie maszynowe jest ogólną nazwą obejmującą pojęcie uczenia głębokiego. Już w połowie lat 50-tych XX w. naukowcy – informatycy (była to wówczas nowa dziedzina nauki), m.in. Marvin Minsky, John McCarthy, Herbert Simon, postawili sobie ambitne zadanie odtworzenia w maszynie ludzkiej inteligencji.

    Badacze sztucznej inteligencji podzielili się na dwa obozy. Jedno podejście opierało się na kodowaniu reguł logicznych. Sprawdzało się ono w prostych, dobrze zdefiniowanych grach, lecz okazywało się zawodne, w przypadku zwiększonego asortymentu możliwych wyborów lub ruchów.  Drugie podejście opierało się na sieciach neuronowych. Jego twórcy nie podejmowali prób uczenia komputerów reguł ludzkiego mózgu, lecz starali się go zrekonstruować, naśladując wewnętrzną architekturę mózgu i konstruując warstwy sztucznych neuronów, mogących otrzymywać i przekazywać określone informacje za pomocą sieci zbliżonej do neuronów biologicznych – wprowadzano jak najwięcej przykładów danego zjawiska. W latach pięćdziesiątych i sześćdziesiątych XX w. ówczesne wersje sztucznych sieci neuronowych dawały obiecujące rezultaty. Następne dekady to krótkie okresy popularności tej koncepcji, po których popadała ona w „niełaskę”.

    Przełom techniczny w uczeniu głębokim nastąpił dopiero w połowie pierwszej dekady XXI w. Geoffrey Hinton odkrył sposób sztucznego uczenia nowych warstw w sieciach neuronowych, zwielokrotniając ich moc. Dzięki temu stało się możliwe m.in. rozpoznawanie przez algorytmy obiektów oraz mowy. Te podrasowane sieci neuronowe zostały przemianowane na „uczenie głębokie”. Niebagatelne znaczenie miało uwzględnienie dwóch podstawowych czynników: mocy obliczeniowej i danych. Dziś nowoczesny smartfon ma miliony większą moc przetwarzania niż np. najnowocześniejsze komputery NASA z lat sześćdziesiątych XX w. użyte do wysłania ludzi na Księżyc.

    Sieci neuronowe, będące przez całe dekady na marginesie badań SI, błyskawicznie opanowały współczesny nam świat. Uczenie głębokie bywa również nazywane „wąską SI” – inteligencją pobierającą dane z jednej konkretnej dziedziny dla optymalizacji wybranego, konkretnego celu. Jest ono tak fascynujące, ponieważ dzięki umiejętności rozpoznawania wzorca, optymalizacji osiągania celu i podejmowaniu na tej podstawie decyzji znajduje zastosowanie w wielu dziedzinach codziennego życia.

    Źródło inspiracji merytorycznej:

    „Inteligencja sztuczna, rewolucja prawdziwa. Chiny, USA i przyszłość świata”, Kai-Fu Lee, Media Rodzina, 2019.

    autor: RSS data: 04.11.2020