Prof. Dr. Christian Schwarz, Dr. Stefan Stein
Der interne Fremdvergleich stellt die realisierten finanziellen Kennziffern (Margen, Kostenaufschläge) von Transaktionen (Geschäftsvorfällen) innerhalb der Unternehmensgruppe den realisierten Margen oder Kostenaufschlägen der Unternehmensgruppe mit fremden Dritten gegenüber. In der Praxis können sich hierbei Unterschiede in den realisierten Finanzkennziffern z. B. dadurch ergeben, dass die Geschäftsvorfälle nicht vollständig vergleichbar sein. Ein typisches Beispiel sind gewährte Rabatte durch größere Abnahmemengen. Da die unternehmerische Preissetzung von verschiedenen Einflussfaktoren (Vergleichbarkeitsfaktoren) geprägt ist, kann so regelmäßig eine Bandbreite an realisierten Margen beobachtet werden.
2.1 Illustrierendes Fallbeispiel
Die multinationale Unternehmensgruppe AB ist in verschiedenen Ländern weltweit tätig. Sie produziert die Maschinen im Inland bei der A GmbH und vertreibt diese über die ausländische Vertriebsgesellschaft B Ltd., welche auch After-Sales Aktivitäten übernimmt. Die Verrechnungspreise werden seitens der A GmbH auf Basis einer Zuschlagskalkulation so ermittelt, wie dies auch gegenüber unabhängigen Vertriebsgesellschaften erfolgt. Der Endkundenpreis laut Preisliste wird durch die A GmbH determiniert, allerdings sind die Vertriebsgesellschaften frei in der Rabattgewährung gegenüber den Endkunden. Die tatsächlichen Vertriebsmargen der unabhängigen Vertriebsgesellschaften sind der A GmbH nicht bekannt. Es liegt ein interner Fremdvergleich vor. Im Folgenden illustriert Abb. 1 den Sachverhalt.
Abb. 1: Schematische Darstellung illustrativer Sachverhalt
Obwohl typischerweise die Wiederverkaufspreismethode eine geeignete Verrechnungspreismethode für diese Geschäftsbeziehungen darstellt, kann bei fehlenden Daten auch der Preissetzungsmechanismus für Zwecke der Überprüfung des Fremdvergleichs herangezogen werden. Dies erscheint insofern gerechtfertigt, als dass die Preislistenpreise vorgegeben sind und die Rabattierung auf den Endkundenpreis seitens der Vertriebsgesellschaften frei verhandelt werden kann.
Als eine neuere Methode der KI soll ein Random Forest Modell zur Anwendung kommen. Diese Methode soll mögliche Unterschiede in der Preissetzung gegenüber den unverbundenen Vertriebsgesellschaften und der gruppeninternen Vertriebsgesellschaft (B Ltd.) Algorithmus-basiert und stärker objektiviert untersuchen. Ziel der Random-Forest Analyse ist es, Unterschiede in den einer Geschäftsbeziehung zugrunde liegenden Bedingungen zu identifizieren und dabei zu analysieren, welche der identifizierten Unterschiede zu einer (systematisch) abweichenden Preissetzung zwischen gruppeninternen (verbundenen) und unabhängigen (unverbundenen) Vertriebsgesellschaften führen.
2.2 Random Forest
Was ist ein Random Forest und wie ist dieser konzeptionell im Bereich KI einzuordnen? Unter KI werden Algorithmen verstanden, die menschliche Entscheidungsregeln "nachahmen". Dabei werden statistische Methoden kombiniert, um u. a. in sehr großen Datensätzen Muster zu erkennen bzw. komplexe (nicht-lineare) Zusammenhänge zu identifizieren.
Als Teilbereich der KI ist das sogenannte "Maschinelle Lernen" (engl.: Machine Learning) sehr prominent. Hierbei "lernen" die Algorithmen der KI auf sogenannten Trainingsdatensätzen Entscheidungsregeln und wenden diese dann auf Validierungsdatensätzen an. In der Anwendungspraxis hat sich gezeigt, dass neben "künstlichen neuronalen Netzen" auch der "Random Forest" sehr gute Resultate (z. B. im Sinne der Prognosegenauigkeit) liefern kann. Der Random Forest Algorithmus wird im Folgenden kurz intuitiv vorgestellt.
Random Forests gehören zur Klasse der Entscheidungsbaum-Algorithmen. Entscheidungsbäume lassen sich intuitiv als hierarchische Top-Down Baumstruktur interpretieren. Hierbei repräsentiert
- jeder "Knoten" des Entscheidungsbaums ein Merkmal der einzelnen Transaktion (z. B. Umsatz, Maschinentyp, Zeitpunkt der Transaktion jeder abhängiger oder unabhängiger Transaktionen),
- jede "Verzweigung" eine Entscheidung des Algorithmus (hier zur Diskriminierung zwischen abhängiger oder unabhängiger Transaktionen) und
- jedes "Blatt" am Ende einer Verzweigung den entsprechenden Ausgabewert (hier Wahrscheinlichkeit-Zuordnung abhängiger oder unabhängiger Transaktionen).
Vergleichbar zu anderen Methoden des maschinellen Lernens wird beim Random Forest der Entscheidungsbaum über einen Lernprozess unter Verwendung von Trainingsdaten erstellt und optimiert. Der Entscheidungsbaum wird Schritt für Schritt entsprechend der Bedeutung der Merkmale durchlaufen. Für jede Teilmenge (Baumverästelung) wird das zweitwichtigste Merkmal identifiziert und eine neue Aufteilung erstellt. Der Vorgang wird so lange wiederholt, bis jedem Blatt am Ende des Entscheidungsbaums ein Zweig eindeutig zugeordnet ist.
Im Gegensatz zu einem einzelnen Entscheidungsbaum ist ein Random Forest eine Gruppe von Einzelbäumen. Jeder Entscheidungsbaum ist verschieden und zunächst individuell zu optimieren, aber alle einzelnen Entscheidungsbäume zusammen bilden einen "Entschei...