БАЗА Енота (gur4el) wrote,
БАЗА Енота
gur4el

Я умный, но не гений. Вот ведь закавыка. Есть задачи, которые нелучается решить, некоторые даже легко и с удовольствием, другие же останутся нерешенными навсегда.
Одна из таких задач не оставляет меня равнодушным, да и мимо многих коих увлекло программирование тоже не прошла стороной. Я буду говорит про попытки научить компьютер думать аки человек.
Начнём с истории вопроса, естественно субъективной. За объективность можете учебники почитать. Люди очень давно не хотят работать и прям тащатся когда что-то рутинное делают за них. В начале рабы, потом машины. Нынче компьютеры и роботы.
Только с думаньем всегда было туго. Поэтому и рабов за людей толком-то не считали.
Тут бы и про тест Тьюринга пару слов ввернуть. Слышал я про ботов, которые часами могут поддерживать разговор, но интеллекта в них ноль. Все за счет статистики и логики сделано. Сейчас головастые гении придумали более продвинутый - ситуационный тест.
Например: Поток машин едет с высокой скоростью. Человек перебегает дорогу. Вопрос: Что скорее всего с ним случится?
Для ребенка 3-х годиков вопросик. Но пока не по зубам программе. Разве что повезет и в базе данных окажется похожая, описанная похожим образом ситуация.
Попробую описать, что должна уметь программа прежде чем появится смысл натравливать ее на ситуационный тест.
1. Зрение.
Казалось бы две камеры подойдут.
Но проблема #1 в том, за 3 года обучения накопится 10000 часов видео. Даже если час видео будет занимать 300 мб (mp4 320*200) это 3 терабайта. Очень плохо. Такой объем информации ни один компьютер за адекватное время не обработает. Следовательно нужен формат хранения, позволяющий хранить данные более компактно.
Желательно в рамках оперативной памяти - 32-128 Гб.
Другая проблема #2 - дублирование и дополнение. Возьмем для примера камеру видеонаблюдения. Даже если она будет снимать одну комнату размер отснятого материала будет пропорционален времени съемки. Требуется разработать алгоритм, работающий сродни медитации. Съемка одной и той же поверхности не должна приводить к увеличению объема данных, разве что незначительному, если съемка будет вестись под разными углами и/или освещением. В формате записи должны быть разделены статическая сцена, динамические объекты и положение камеры. Так что если происходит перемещение объектов в помещении - новые данные - это новые координаты объектов.
Проблема #3 человек видит пятнами, а не пикселями. Если реализовать алгоритм хранения изображений в "пятенном" формате, то первые две проблемы решать будет полегче.
2. Если не зрение, то что?
Система должна поддерживать ручную настройку и "допиливание". Отчасти поэтому нейронные сети, работая хорошо для решения некоторых задач, для этой не подойдут, хотя применение не исключено. Как я себе это представляю. В системе создается объект и прописываются все возможные его свойства в категорийной форме. Хотя нет. Описание объекта должно генерироваться автоматически на основе эталона, но при этом должна быть возможность вносить коррекции. В данной постановке задачи ключевым видится создание формата данных, которым можно было бы описать любой объект, свойство и любую взаимосвязь между объектами и свойствами.
Subscribe
  • Post a new comment

    Error

    default userpic
    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 4 comments