<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" article-type="research-article" dtd-version="1.3" xml:lang="ru">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">rst</journal-id>
      <journal-title-group>
        <journal-title xml:lang="ru">Информационно-экономические аспекты стандартизации и технического регулирования</journal-title>
        <trans-title-group xml:lang="en">
          <trans-title>Informatsionno-ekonomicheskiye aspekty standartizatsii i tekhnicheskogo regulirovaniya</trans-title>
        </trans-title-group>
      </journal-title-group>
      <issn pub-type="epub">2311-1348</issn>
      <publisher>
        <publisher-name>ФГБУ «Институт стандартизации»</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id custom-type="edn" pub-id-type="custom">WWALNW</article-id>
      <article-id custom-type="elibrary-id" pub-id-type="custom">89068829</article-id>
      <article-categories>
        <subj-group subj-group-type="heading">
          <subject>Research Article</subject>
        </subj-group>
        <subj-group subj-group-type="section-heading" xml:lang="ru">
          <subject>Диссертационные исследования</subject>
        </subj-group>
        <subj-group subj-group-type="section-heading" xml:lang="en">
          <subject>dissertation research</subject>
        </subj-group>
      </article-categories>
      <title-group>
        <article-title>ОТКРЫТЫЕ ТАБЛИЧНЫЕ ФОРМАТЫ В БАНКОВСКОЙ АНАЛИТИКЕ: ПРАКТИЧЕСКОЕ ИССЛЕДОВАНИЕ ICEBERG И PAIMON</article-title>
        <trans-title-group xml:lang="en">
          <trans-title>OPEN TABLE FORMATS IN BANKING ANALYTICS: A PRACTICAL STUDY OF ICEBERG AND PAIMON</trans-title>
        </trans-title-group>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Иевлев</surname>
              <given-names>Кирилл Олегович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Ievlev</surname>
              <given-names>K. О.</given-names>
            </name>
          </name-alternatives>
          <bio xml:lang="ru">
            <p>Иевлев Кирилл Олегович, Аспирант, ассистент кафедры «Интеллектуальный анализ данных» ФГБОУ ВО «Московский технический университет связи и информатики»</p>
            <p>Москва, Россия</p>
          </bio>
          <bio xml:lang="en">
            <p>Ievlev K. О., Graduate student, Lecturer assistant at  the department of data mining Moscow Technical University of Communications and Informatics</p>
            <p>Moscow, Russia</p>
          </bio>
          <xref ref-type="aff" rid="aff-1"/>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Сурпин</surname>
              <given-names>Вадим Павлович</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Surpin</surname>
              <given-names>V. P.</given-names>
            </name>
          </name-alternatives>
          <bio xml:lang="ru">
            <p>Сурпин Вадим Павлович, Исполнительный директор Сбербанк России</p>
            <p>Москва, Россия</p>
          </bio>
          <bio xml:lang="en">
            <p>Surpin V. P., Executive Director Sberbank</p>
            <p>Moscow, Russia</p>
          </bio>
          <xref ref-type="aff" rid="aff-1"/>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name-alternatives>
            <name name-style="eastern" xml:lang="ru">
              <surname>Городничев</surname>
              <given-names>Михаил Геннадьевич</given-names>
            </name>
            <name name-style="western" xml:lang="en">
              <surname>Gorodnichev</surname>
              <given-names>M. G.</given-names>
            </name>
          </name-alternatives>
          <bio xml:lang="ru">
            <p>Городничев Михаил Геннадьевич, Доцент, Декан факультета «Информационные технологии», заведующий кафедрой «Математическая кибернетика и информационные технологии» ФГБОУ ВО «Московский технический университет связи и информатики»</p>
            <p>Москва, Россия</p>
          </bio>
          <bio xml:lang="en">
            <p>Gorodnichev M. G., Associate professor, Dean of Information Technologies Faculty, Head of Mathematical Cybernetics and Information Technologies Department Technical University of Communications and Informatics</p>
            <p>Moscow, Russia</p>
          </bio>
          <xref ref-type="aff" rid="aff-1"/>
        </contrib>
      </contrib-group>
      <aff-alternatives id="aff-1">
        <aff xml:lang="ru">
          ФГБОУ ВО «Московский технический университет связи и информатики»
          <country>Россия</country>
        </aff>
        <aff xml:lang="en">
          Moscow Technical University of Communications and Informatics
          <country>Russian Federation</country>
        </aff>
      </aff-alternatives>
      <pub-date pub-type="collection">
        <year>2026</year>
      </pub-date>
      <volume>96</volume>
      <issue>88</issue>
      <fpage>84</fpage>
      <lpage>89</lpage>
      <permissions>
        <copyright-statement>Copyright © Иевлев К. О., Сурпин В. П., Городничев М. Г., 2026</copyright-statement>
        <copyright-year>2026</copyright-year>
        <copyright-holder xml:lang="ru">Иевлев К. О., Сурпин В. П., Городничев М. Г.</copyright-holder>
        <copyright-holder xml:lang="en">Ievlev K. О., Surpin V. P., Gorodnichev M. G.</copyright-holder>
        <license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple" xml:lang="ru">
          <license-p>Данная работа распространяется под лицензией Creative Commons Attribution 4.0.</license-p>
        </license>
      </permissions>
      <self-uri xlink:href="https://iea.gostinfo.ru/article/view/29">https://iea.gostinfo.ru/article/view/29</self-uri>
      <abstract>
        <p>Цифровизация бизнеса, особенно в таких динамичных и конкурентных сферах, как финтех, реклама и телеком, привела к необходимости обрабатывать огромные объемы гетерогенных данных, поступающих от независимых поставщиков. Практическая невозможность строгой координации обмена данными и потребность принимать данные «как есть» обусловили преобладание ELT-подхода и гибких data lake в первичных слоях, отодвинув традиционный ETL и строгие реляционные БД ближе к слою витрин данных. При этом привычная реляционная модель, SQL-семантика и потребность в ACID-гарантиях привели к появлению открытых табличных форматов и архитектуры lakehouse. В работе рассматривается применение Open Table Formats, типичных для lakehouse архитектуры, в аналитической платформе финансовой организации. Приводятся результаты двух экспериментов: первый эксперимент моделирует сопровождение витрины данных на таблице 1 ТБ (~10 млрд ключей) с последовательными SELECT/UPDATE по 10-50% записей. Сравниваются партицированный Parquet, Iceberg (copy-on-write и merge-on-read) и Paimon (merge-on-read).Исследование предоставляет практические рекомендации по выбору табличного формата для lakehouse-архитектур с учетом профиля нагрузки и операционных требований.</p>
      </abstract>
      <trans-abstract xml:lang="en">
        <p>Business digitalization, particularly in dynamic and competitive sectors such as fintech, advertising, and telecommunications, has led to the necessity of processing massive volumes of heterogeneous data from independent providers. The practical impossibility of strict data exchange coordination and the need to accept data “as is” have resulted in the predominance of the ELT approach and flexible data lakes in primary layers, pushing traditional ETL and strict relational databases closer to the data mart layer. At the same time, the familiar relational model, SQL semantics, and the need for ACID guarantees have led to the emergence of open table formats and lakehouse architecture. This paper examines the application of Open Table Formats, typical for lakehouse architecture, in the analytical platform of a financial organization. The results of two experiments are presented: the first experiment models data mart maintenance on a 1 TB table (~10 billion keys) with sequential SELECT/UPDATE operations on 10-50% of records. Partitioned Parquet, Iceberg (copy-on-write and merge-on-read), and Paimon (merge-on-read) are compared. The study provides practical recommendations for selecting a table format for lakehouse architectures, taking into account workload profiles and operational requirements.</p>
      </trans-abstract>
      <kwd-group xml:lang="ru">
        <kwd>APACHE PAIMON</kwd>
        <kwd>APACHE ICEBERG</kwd>
        <kwd>DATA LAKEHOUSE</kwd>
        <kwd>OLAP</kwd>
        <kwd>COPY-ON-WRITE</kwd>
        <kwd>MERGE-ON-READ</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>APACHE PAIMON</kwd>
        <kwd>APACHE ICEBERG</kwd>
        <kwd>DATA LAKEHOUSE</kwd>
        <kwd>OLAP</kwd>
        <kwd>COPY-ON-WRITE</kwd>
        <kwd>MERGE-ON-READ</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <title>References</title>
    </ref-list>
    <fn-group>
      <fn fn-type="conflict">
        <p xml:lang="ru">Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.</p>
        <p xml:lang="en">The authors declare that there are no conflicts of interest present.</p>
      </fn>
    </fn-group>
  </back>
</article>
