Как произхожда терминът?

Точният произход на термина „дълбоко обучение“ е неясен, но обикновено се приписва на множество източници. Ето няколко възможни произхода:

1. Документът на Джефри Хинтън от 2006 г. :През 2006 г. компютърният учен Джефри Хинтън публикува семинарен документ, озаглавен „Дълбоко обучение:Урок за дълбоки невронни мрежи“ в списание Nature. Този документ се счита за забележителност в областта на изкуствените невронни мрежи и спомага за популяризирането на термина „дълбоко обучение“. Хинтън и неговите колеги от Университета в Торонто се считат за пионери в развитието на техники за дълбоко обучение.

2. Използването на Йошуа Бенгио от термина :Йошуа Бенгио, друг изтъкнат изследовател в тази област, също изигра значителна роля в популяризирането на термина „дълбоко обучение“ в началото на 2000 -те. Бенгио и неговите колеги от Université de Montréal проведоха новаторски изследвания на алгоритмите за дълбоко обучение и той често използваше термина „дълбоко обучение“ в своите изследователски публикации.

3. Влияние на когнитивната психология :Някои смятат, че вдъхновението за термина "дълбоко учене" може да дойде от понятието "дълбока структура" в когнитивната психология. Дълбоката структура е термин, използван в лингвистиката и когнитивната психология за описание на основното представяне или синтаксис на език, който надхвърля характеристиките на повърхностно ниво на думи и фрази. Тази концепция може да е повлияла на разбирането на моделите за дълбоко обучение като улавяне на основните модели и сложни взаимоотношения в данните.

4. Сравнение с традиционното машинно обучение :Терминът "дълбоко обучение" вероятно е монтиран, за да го разграничи от традиционните методи на машинно обучение. Докато традиционните алгоритми за машинно обучение често разчитат на плитки невронни мрежи или плитки представи на данни, дълбокото обучение включва използването на дълбоки невронни мрежи с множество скрити слоеве. Тези дълбоки архитектури позволяват по-сложно и йерархично извличане на характеристики, което позволява на моделите да научат представянето на данни от по-високо ниво на данните.

5. Исторически контекст :В първите дни на изследванията на невронната мрежа плитките невронни мрежи бяха норма и те се сблъскаха с ограничения в своите представителни възможности и способността да се справят с сложни проблеми. Появата на мощни изчислителни ресурси, като графични единици за обработка (GPU), в края на 2000 -те години направи възможно обучението на по -дълбоки невронни мрежи ефективно. Този исторически контекст допринесе за необходимостта от термин, който обхвана напредъка и повишена сложност на тези нови подходи, следователно терминът „дълбоко обучение“ придоби сцепление.

Вероятно е комбинация от тези фактори, заедно с конвергенцията на изследователските усилия и пробиви, доведе до широкото приемане на термина „дълбоко обучение“, за да се опише подфийлдът в рамките на машинното обучение, фокусиран върху дълбоки невронни мрежи.