コグノスのチュートリアル学習マニュアル

Published on 2023-04-20 00:10:05 · 中文 · English · بالعربية · Español · हिंदीName · Русский язык · 中文繁體

IBM Cognos ビジネス・インテリジェンスは、Web ベースのレポート作成および分析ツールです。 これは、データ集約を実行し、ユーザーフレンドリーな詳細なレポートを作成するために使用されます。 IBM Cognos は幅広い機能を提供し、中規模から大規模の企業に柔軟なレポート作成環境を提供するエンタープライズ・ソフトウェアと見なすことができます。 Cognos には、レポートを XML 形式または PDF 形式でエクスポートするか、XML 形式で表示するオプションもあります。
データウェアハウスは、データウェアハウスによって次の場所から作成されます。 分析レポートと意思決定のための 複数の異種データソースからのデータで構成されています。 データ ウェアハウスは、異なるデータ ソースやアプリケーションからのデータを格納するための中心的な場所です。
データウェアハウスという用語は、1990年にビルインモムによって最初に発明されました。 データ ウェアハウスは、常にオペレーション データベースから分離されています。
DW システムのデータは、オペレーショナルトランザクションシステムからロードされます。
セールス マーケティング 人事 ティッカー
情報処理のためにDWシステムにロードする前に、データストアの操作やその他の変換を行うことができます。
データウェアハウスは、情報のレポートと分析、および履歴データと現在のデータの保存に使用されます。 DW システムからのデータは分析レポートで使用され、後でビジネス アナリスト、営業マネージャー、またはナレッジ ワーカーが意思決定を行うために使用します。
数据仓库
上の画像では、データがから来たことがわかります データ ウェアハウスに対する 複数の異種データ ソース。 データウェアハウスの一般的なデータソースは次のとおりです。
データベースの運用 SAP アプリケーションと非 SAP アプリケーション フラット ファイル (xls、csv、txt ファイル)
データ ウェアハウス内のデータは、分析レポート、データ マイニング、および分析のために BI (ビジネス インテリジェンス) ユーザーによってアクセスされます。 これは、ビジネスユーザー、セールスマネージャー、アナリストが将来の戦略を定義するための意思決定を行うために使用されます。

データウェアハウスの機能

これは、1 つ以上の異種データ ソースからのデータを格納する中央データ リポジトリです。 DW システムは、現在のデータと履歴データを格納します。 通常、DW システムは 5 年から 10 年の履歴データを格納します。 DW システムは、常に運用トランザクション システムから分離されています。
DW システムのデータは、四半期ごとに比較されるさまざまなタイプの分析レポートに使用されます。

データウェアハウジングと運用データベース

データ ウェアハウスとオペレーショナル データベースの違いは次のとおりです。
オペレーティング システムは、ユーザー レコードの更新、レコードの検索など、既知のワークロードとトランザクション用に設計されています。 ただし、データ ウェアハウスのトランザクションはより複雑で、一般的な形式のデータを使用します。 オペレーティング システムには組織の現在のデータが含まれ、データ ウェアハウスには通常履歴データが含まれます。 オペレーション データベースは、複数のトランザクションの並列処理をサポートします。 データベースの整合性を維持するには、同時実行の制御と回復のメカニズムが必要です。 オペレーション データベース クエリでは読み取り操作と変更操作 (挿入、削除、更新) が許可されますが、OLAP クエリでは格納されたデータへの読み取り専用アクセスが必要です (Select ステートメント)。

データ ウェアハウス スキーマ

データウェアハウジングには、データクレンジング、データ統合、およびデータ統合が含まれます。 データウェアハウスには3層アーキテクチャがあります。

データ ソース層

データがデータ ウェアハウスに入る方法を定義します。 これには、さまざまなデータ ソースと操作トランザクション システム、フラット ファイル、アプリケーションなどが含まれます。

統合レイヤー

これは、オペレーショナル・データ・ストアとステージング領域で構成されます。 ステージング領域は、データ クレンジング、データ変換、およびさまざまなソースからデータ ウェアハウスへのデータの読み込みを実行するために使用されます。 異なるタイム ゾーンで抽出できるデータ ソースは複数あるため、ステージング領域を使用してデータを格納し、データを変換します。

プレゼンテーション層

これは、エンド ユーザーによる BI レポートを実行するために使用されます。 DW システムのデータには、レポート作成と分析のために BI ユーザがアクセスします。
次の図は、データ ウェアハウス システムの一般的なアーキテクチャを示しています。
数据仓库架构

データウェアハウスの特性

データウェアハウスの主な特徴は次のとおりです。
トピック指向- DWシステムでは、データはエクイティプラン、株式、ローンなどのアプリケーションではなく、ビジネストピックごとに分類および保存されます。 統合 - 複数のデータ ソースからのデータは、データ ウェアハウスに統合されます。 不揮発性 - データ ウェアハウス内のデータは不揮発性です。 つまり、データが DW システムにロードされるとき、データは変更されません。 時間変数 - DW システムには履歴データが含まれますが、現在のデータのみを含むトランザクション システムと比較されます。 データ ウェアハウスでは、3 か月、6 か月、1 年、5 年などのデータを表示できます。

OLTP と OLAP の比較

まず第一に、OLTPは オンライントランザクション処理、OLAPは オンライン分析処理
OLTP システムでは、挿入、更新、削除などの短いオンライン トランザクションが多数あります。
OLTP システムでは、有効なメトリックは短いトランザクションの処理時間であり、これは非常に短いです。 マルチアクセス環境でデータの整合性を制御します。 OLTP システムの場合、毎秒のトランザクションは有効性を測定します。 OLTP データ ウェアハウス システムには、現在のデータと詳細データが含まれており、エンティティ モデル (3NF) のスキーマで維持されます。
例えば-
顧客レコードを毎日挿入、更新、および削除する小売店の日次トランザクション システム。 これにより、クエリ処理が高速になります。 OLTP データベースには、詳細な現在のデータが含まれています。 OLTP データベースの格納に使用されるスキーマはエンティティ モデルです。
OLAP システムでは、トランザクション システムに比べてトランザクションの数が少ないです。 実行されるクエリは本質的に複雑であり、データの集約を伴います。

集計とは

年次(1行)、四半期(4行)、月次(12行)などの集計データを含むテーブルを保存し、誰かが年次比較を行う必要がある場合は、1行のみが処理されます。 ただし、集計されていないテーブルでは、すべての行が比較されます。 これは集計と呼ばれます。
OLAP システムで使用できる集計関数には、合計、平均、最大、整数など、さまざまな関数があります。
例えば-
SELECT Avg(salary)
FROM employee
WHERE title = 'Programmer';

主な違い

OLAP システムと OLTP システムの主な違いは次のとおりです。
インデックス - OLTP システムにはインデックスがほとんどありませんが、OLAP システムにはパフォーマンス チューニング用のインデックスが多数あります。 結合 - OLTP システムでは、多数の接続とデータが正規化されます。 ただし、OLAP システムでは、結合は少なく、非正規化されています。 集計 - OLTP システムでは、データは集計されず、OLAP データベースではより多くの集計が使用されます。 正規化 - OLTP システムには正規化されたデータが含まれていますが、OLAP システムでは正規化されません。 OLTP

データ マートとデータ ウェアハウス

データ マートは 1 つの機能領域に重点を置き、データ ウェアハウスの最も単純な形式を表します。 営業、マーケティング、人事、および財務データを含むデータ ウェアハウスについて考えてみます。 データ マートは、営業やマーケティングなどの 1 つの機能領域に重点を置いています。
数据集市与数据仓库
上の図では、データ ウェアハウスとデータ マートの違いを確認できます。
ディメンション テーブルは、ディメンションの特性を表します。 顧客ディメンションには、Customer_Name、Phone_No、性別などを含めることができます。