Централизованная инфраструктура данных нарушает принципы Web3

Централизованная инфраструктура данных нарушает принципы Web3

Мнение автора: Майкл О’Рурке, основатель Pocket Network и генеральный директор компании Grove

Открытые данные в настоящее время играют значительную роль в построении глобальной экономики развивающихся технологий, оценочно превышая рыночную стоимость в $350 миллиардов. Однако открытые источники данных часто полагаются на централизованную инфраструктуру, что противоречит философии автономии и защиты от цензуры.

Чтобы раскрыть свой потенциал, открытые данные должны перейти на децентрализованную инфраструктуру. Как только каналы открытых данных начнут использовать децентрализованную и открытую инфраструктуру, многие уязвимости пользовательских приложений будут устранены.

Открытая инфраструктура имеет множество применений: от хостинга децентрализованного приложения (DApp) или торгового бота до обмена исследовательскими данными для обучения и вывода моделей больших языковых моделей (LLM). Подробное изучение каждого из них может помочь лучше понять, почему децентрализованная инфраструктура для открытых данных более полезна, чем централизованная.

Доступное обучение и вывод LLM 

Запуск открытого ИИ DeepSeek, который стер $1 триллион с технических рынков США, демонстрирует силу открытых протоколов. Это сигнал сосредоточиться на новой мировой экономике открытых данных.

Во-первых, закрытые, централизованные ИИ модели имеют высокие затраты на обучение LLM и генерирование точных результатов.

Неудивительно, что финальная стадия обучения DeepSeek R1 обошлась примерно в $5,5 миллиона, по сравнению с более чем $100 миллионами для GPT-4 от OpenAI. Тем не менее, индустрия ИИ по-прежнему полагается на централизованные платформы инфраструктуры, такие как LLM API провайдеры, что противоречит инновациям в области открытого исходного кода. 

Хостинг моделей с открытым исходным кодом, таких как Llama 2 и DeepSeek R1, прост и недорогостоящ. В отличие от состояневых блокчейнов, требующих постоянной синхронизации, LLM не имеют состояния и требуют только периодических обновлений. 

Несмотря на простоту, вычислительные расходы на запуск вывода открытых моделей высоки, так как операторам узлов необходимы графические процессоры. Эти модели могут сэкономить на стоимости, так как они не требуют обновлений в реальном времени для постоянной синхронизации.

Появление обобщаемых базовых моделей, таких как GPT-4, позволило развивать новые продукты через контекстуальный вывод. Централизованные компании, такие как OpenAI, не позволят случайной сети поддерживать или выполнять вывод из их обученной модели.

Наоборот, операторы децентрализованных узлов могут поддерживать развитие открытых LLM, служа конечными точками ИИ для предоставления детерминированных данных клиентам. Децентрализованные сети снижают барьеры для входа, позволяя операторам запускать свой шлюз поверх сети.

Эти децентрализованные протоколы инфраструктуры обрабатывают миллионы запросов в своих открытых сетях, раскрывая основные шлюзы и сервисы с открытым исходным кодом. Соответственно, любой предприниматель или оператор может развернуть свой шлюз и выйти на растущий рынок.

Например, кто-то может обучить LLM с использованием децентрализованных вычислительных ресурсов в разрешенном протоколе Akash, который позволяет централизовать услуги с ценами на 85% ниже, чем облачные провайдеры.

Рынок обучения и вывода ИИ имеет огромный потенциал. Компании в области ИИ тратят приблизительно $1 миллион в день на обслуживание инфраструктуры для выполнения выводов LLM. Это выносит доступный к обслуживанию рынок (SAM) примерно до $365 миллионов в год.

Как показывают данные, рыночные условия указывают на значительный потенциал роста децентрализованной инфраструктуры.

Доступное распространение исследовательских данных

В научной и исследовательской области обмен данными вместе с машинным обучением и LLM может значительно ускорить исследования и улучшить жизнь людей. Доступ к этим данным был ограничен дорогой системой журналов, которая выборочно публикует исследования, одобренные ее советом, и которые в целом недоступны из-за дорогих подписок.

С развитием моделей машинного обучения на основе блокчейна с нулевым знанием данные теперь могут обмениваться и обрабатываться надежно, с сохранением конфиденциальности без раскрытия чувствительных данных. Таким образом, исследователи и ученые могут обмениваться и получать данные исследований без деанонимизации потенциально ограниченной личной информации. 

Для устойчивого обмена открытыми исследовательскими данными исследователям нужен доступ к децентрализованной инфраструктуре, которая вознаграждает их за доступ к данным, исключая посредников. Стимулированная сеть открытых данных может гарантировать, что научные данные останутся доступными за пределами огороженного пространства дорогих журналов и частных корпораций.

Непрекращаемый хостинг DApp

Централизованные платформы для хостинга данных, такие как Amazon Web Services, Google Cloud и Microsoft Azure, популярны среди разработчиков приложений. Несмотря на легкий доступ, централизованные платформы подвержены единой точке отказа, влияя на надежность и приводя к редким, но возможным сбоям.

В истории технологий есть множество примеров, когда платформы Infrastructure-as-a-Service не смогли обеспечить непрерывные услуги.

Например, в 2022 году MetaMask временно отказал в доступе пользователям из определенных географических регионов, потому что Infura заблокировала их после некоторых санкций США. Хотя MetaMask является децентрализованным, его стандартные соединения и конечные точки зависят от централизованных технологий, таких как Infura, для доступа к Ethereum.

Это не было единичным случаем. Клиенты Infura также столкнулись с перебоями в 2020 году, в то время как Solana и Polygon испытали перегрузку централизованных удаленных вызовов процедур (RPC) во время пикового трафика.

Одной компании сложно удовлетворить различные потребности разработчиков в развивающейся экосистеме открытого кода. Существуют тысячи протоколов уровня 1, rollup, индексации, хранения и других промежуточных программ с нишевыми случаями использования.

Большинство централизованных платформ, как RPC-провайдеры, продолжают строить одну и ту же инфраструктуру, что создает трение, замедляет темпы роста и влияет на масштабируемость, потому что протоколы сосредотачиваются на перестроении фундамента вместо добавления новых функций.

Наоборот, огромный успех децентрализованных социальных сетевых приложений, таких как BlueSky и AT Protocol, сигнализирует о стремлении пользователей к децентрализованным протоколам. Пройдя мимо централизованных RPC к доступу к открытым данным, такие протоколы напоминают нам о необходимости создавать и работать с децентрализованной инфраструктурой.

Например, децентрализованный финансовый протокол может получать данные о ценах по цепочке от Chainlink, чтобы прекратить зависимость от централизованных API для получения данных о ценах и рыночных данных в реальном времени.

На рынке Web3 около 100 миллиардов обрабатываемых запросов RPC, стоимостью $3–$6 за миллион запросов. Таким образом, общий доступный рыночный объем Web3 RPC составляет $100–$200 миллионов в год. С устойчивым ростом новых уровней доступности данных возможно более 1 триллиона запросов RPC в день.

Необходимо ориентироваться на децентрализованную инфраструктуру, чтобы оставаться в синхронизации с передачей открытых данных и войти на рынок данных с открытым исходным кодом.

Открытые данные требуют децентрализованной инфраструктуры

В долгосрочной перспективе мы увидим, как обобщенные клиенты блокчейна разгружают хранение и сеть на специализированные промежуточные протоколы.

Например, Solana возглавил децентрализационное движение, когда он впервые начал хранить свои данные в цепочках, таких как Arweave. Неудивительно, что Solana и Phantom снова стали основными инструментами для обработки огромного трафика на президентский мемкойн TRUMP, ключевого момента в финансовой и культурной истории.

В будущем мы увидим больше данных, проходящих через инфраструктурные протоколы, создавая зависимости от платформ промежуточного обеспечения. По мере того, как протоколы становятся более модульными и масштабируемыми, они создадут пространство для интеграции открытых децентрализованных промежуточных программ на уровне протокола.

Невероятно иметь централизованные компании в качестве посредников для легких заголовков клиентов.

Децентрализованная инфраструктура является надежной, распределенной, экономически эффективной и защищенной от цензуры. В результате децентрализованная инфраструктура станет стандартным выбором для разработчиков приложений и компаний, что приведет к взаимовыгодной истории роста.

Мнение автора: Майкл О’Рурке, основатель Pocket Network и генеральный директор компании Grove.

Эта статья предоставлена для общих информационных целей и не предназначена быть и не должна восприниматься в качестве юридического или инвестиционного совета. Высказанные здесь взгляды, мнения и идеи принадлежат исключительно автору и не обязательно отражают или представляют взгляды и мнения dc.finance.