【ITニュース解説】Fórmulas de Excel/Sheets que ni la IA puede resolver (aún)
2025年09月13日に「Dev.to」が公開したITニュース「Fórmulas de Excel/Sheets que ni la IA puede resolver (aún)」について初心者にもわかりやすく解説しています。
ITニュース概要
AIでは難しいExcel/Google Sheetsの高度な数式集が公開された。複雑なデータ処理や分析の課題を解決し、作業効率を向上させる。これらの数式はGitHubで公開されており、システムエンジニアを目指す初心者がデータ分析力を高めるのに役立つ。
ITニュース解説
システムエンジニアを目指す上で、データ処理は避けて通れない重要な分野だ。企業や組織では日々膨大なデータが生成され、それらを整理し、分析することで意思決定や業務改善が行われる。このデータ処理の現場で、プログラミング言語を用いたシステム開発と並行して、Microsoft ExcelやGoogle Sheetsのような表計算ソフトも非常に重要なツールとして活用されている。これらのツールは、データベースから抽出されたデータを一時的に扱ったり、小規模なデータ分析を行ったり、プロトタイプとしてデータ処理ロジックを検証したりと、多岐にわたる役割を担っている。
しかし、一見シンプルな表計算ソフトも、扱うデータが複雑になったり、その量が膨大になったりすると、途端に難易度が跳ね上がる。たとえば、数千行にも及ぶ従業員データの中から「この従業員は過去に部署異動を経験しているか?」や、顧客リストから「この顧客は今回初めて登録されたのか?」といった、一見簡単そうに見える問いに答えるためには、高度な論理的思考と、表計算ソフトの数式を深く理解している必要がある。単純な検索やフィルター機能だけでは対応できない、複雑な条件でのデータ抽出や集計が求められる場面が頻繁に発生するのだ。
近年、AI技術の発展により、このようなデータ処理の課題に対してもAIが解決策を提案してくれることが増えた。AIに「Excelで〇〇をしたい」と質問すれば、適切な数式を教えてくれることも少なくない。しかし、現実のデータは往々にして「きれい」ではない。入力ミス、表記ゆれ、欠損データなど、多種多様な「汚れ」を含んでいる。AIが提供する数式は、多くの場合、理想的なデータ構造を前提としているため、少しでもデータの形が変わると正しく機能しなくなってしまうことがある。例えば、日付計算でうるう年が考慮されていなかったり、特定の文字列が少しでも異なると重複判定ができなかったりするケースがこれに当たる。結果として、AIの提案だけでは不十分で、結局手作業でデータを修正したり、数式を複雑に調整したりする手間がかかり、かえって時間がかかってしまうことも少なくない。これは、AIがまだ、現実世界の複雑で多様なデータパターンすべてを網羅して学習しているわけではないという、現在のAIの限界を示している。
このようなAIでも解決しきれない現実のデータ処理課題に対し、長年の経験と深い知識を持つ専門家が自ら解決策を構築するケースがある。今回紹介するニュース記事では、著者が政府機関や学術機関といった実際の現場で、まさにこのような「AIが解決できない複雑なデータ問題」に直面し、それを乗り越えるために独自の「高度なExcel/Google Sheets数式」を開発した経緯が語られている。彼が作り上げた数式は、一般的な入門書やオンラインチュートリアルで紹介されているような基本的なものではなく、大量のデータにも効率的に対応し、複雑な条件を正確に処理できるように最適化されている。
これらの数式はGitHubというウェブサービス上で公開されている。GitHubは、主にプログラミングのソースコードを管理・共有するためのプラットフォームとして有名だが、このように実用的なツールや知識を共有する場としても活用されている。今回公開されたリポジトリでは、以下のような具体的な問題に対する解決策が提供されている。
例えば、「データ状態の判定」は、ある記録が新しいものなのか、それとも既に存在するデータが特定の状態を繰り返しているのか(例えば、学生が留年しているのか、それとも順調に進級しているのか)を識別するための数式だ。これは、データの時系列分析や状態管理において非常に重要になる。また、「実質の学年/勤務年数の計算」では、MAX.SI.CONJUNTOのような関数を用いて、あるエンティティ(個人など)にとっての最も新しいサービス年や学習年を正確に算出する。これは、例えば従業員の最も新しい役職や、学生の現在の学年を特定する際に役立つ。
さらに、「登録の初回判定」という数式も非常に実用的だ。これはCONTAR.SIのような関数を使って、特定の記録がリストに初めて登場したものであるかどうかを識別する。顧客データの重複カウントを防ぎ、真の新規顧客数を把握するためなどに不可欠な機能だ。また、「繰り返し回数のカウント」では、CONTAR.SI.CONJUNTO関数を使い、例えば特定の個人が特定の学期を何回繰り返しているか、といった詳細な情報を集計することができる。そして、多くの人が一度は悩むであろう「正確な年齢計算」についても、ENTERO(AÑO(HOY())-AÑO(G2)-...)のような複雑な論理を組み合わせて、うるう年などを考慮し、現在の年月日を基準に正確な満年齢を算出する数式が提供されている。これらの数式は、単にデータを見るだけではわからない、深い洞察を引き出すための強力なツールとなる。
著者はこれらの貴重な数式を共有する一方で、その知的財産権も明確にしている。リポジトリは「All Rights Reserved(すべての権利を留保)」というライセンスで公開されており、これは、開発された数式が著者の創造的な労働の成果であることを示している。個人的な学習や教育目的での利用は推奨されているが、営利目的のプロジェクトや企業、政府機関での使用には、著者に連絡を取り、別途ライセンスを取得する必要がある。これは、システムエンジニアとして将来的に自身が開発したソフトウェアやソリューションを公開する際に、知的財産権やライセンスがどのように機能するかを理解するための良い例となるだろう。
このように、今回のニュース記事は、AIが万能ではないこと、そして現実世界の複雑なデータ問題には、人間の深い知識と経験に基づいた、より堅牢で具体的な解決策が必要であることを教えてくれる。システムエンジニアを目指す皆さんにとって、これは非常に重要な学びとなる。プログラミングだけでなく、既存のツールをどれだけ深く理解し、それらを活用して複雑な問題を解決できるかという能力は、実際の業務現場で大きな価値を持つからだ。常に新しい技術を学びつつも、足元のツールを使いこなすための実践的なスキルを磨くことの重要性を再認識させてくれる事例だと言えるだろう。