Verfahrensgang
SG Stuttgart (Urteil vom 01.09.1993) |
Tenor
Auf die Revisionen der Beklagten und der Beigeladenen zu 1) wird das Urteil des Sozialgerichts Stuttgart vom 1. September 1993 aufgehoben.
Die Klage gegen den Bescheid der Prüfungskommission vom 20. Januar 1993 wird abgewiesen.
Im übrigen wird die Sache zur erneuten Verhandlung und Entscheidung an das Landessozialgericht Baden-Württemberg zurückverwiesen.
Tatbestand
I
Die Kläger, die eine allgemeinärztliche Gemeinschaftspraxis führen, setzten in der Ersatzkassenabrechnung für das zweite Quartal 1992 die Leistungen nach den Gebührennummern 825 und 851 der Ersatzkassen-Gebührenordnung (E-GO) – bezogen auf je 100 Behandlungsfälle – 2,9 bzw 3,2 mal so häufig an wie der Durchschnitt der diese Leistungen ebenfalls ausführenden Allgemeinärzte. Die Prüfungseinrichtungen sahen darin eine Unwirtschaftlichkeit und strichen die über das Doppelte des Fachgruppendurchschnitts hinausgehenden Leistungsansätze.
Zur Begründung führte die beklagte Beschwerdekommission im Bescheid vom 4. Mai 1993 aus, die streitigen Gebührenpositionen seien bereits mehrfach in früheren Quartalen Gegenstand von Beanstandungen gewesen. Gründe, die eine Überschreitung der Vergleichswerte um mehr als 100 % rechtfertigen könnten, seien weder früher noch jetzt erkennbar geworden.
Das dagegen angerufene Sozialgericht (SG) Stuttgart hat mit Urteil vom 1. September 1993 den Bescheid der Beklagten und den vorangegangenen Bescheid der Prüfungskommission aufgehoben. Die von den Prüfgremien angewandte statistische Methode „Relative Abweichung vom Fachgruppendurchschnitt” sei, wie sich aus einem in anderer Sache eingeholten statistischen Gutachten in Verbindung mit der einschlägigen Fachliteratur ergebe, für eine Prüfung der Wirtschaftlichkeit der Behandlungsweise nach Durchschnittswerten ungeeignet, weil sie die Streuungsverhältnisse innerhalb der Vergleichsgruppe unberücksichtigt lasse und keine Aussage darüber ermögliche, mit welcher Wahrscheinlichkeit der im konkreten Fall aufgetretene Mehraufwand auf bloßem Zufall beruhe. Aus diesem Grunde könne aus prozentualen Überschreitungen des Fachgruppendurchschnitts keine Vermutung der Unwirtschaftlichkeit hergeleitet werden. Die Verwendung einer ungeeigneten statistischen Methode ziehe zwangsläufig Fehler bei der Ausübung des Beurteilungsspielraums nach sich und habe somit die Rechtswidrigkeit des Kürzungsbescheides zur Folge.
Mit der vom SG zugelassenen Revision rügen die Beklagte und die zu 1) beigeladene Kassenärztliche Vereinigung (KÄV), das angefochtene Urteil verletze § 106 Fünftes Buch Sozialgesetzbuch (SGB V) und die dazu von der Rechtsprechung des Bundessozialgerichts (BSG) entwickelten Grundsätze der Wirtschaftlichkeitsprüfung. Die Prüfung nach Durchschnittswerten werde entgegen den gesetzlichen Vorgaben ausschließlich als statistische Vergleichsprüfung verstanden und zu einem rein mathematischen Berechnungsvorgang „degradiert”. Medizinische Erwägungen und das ärztliche Fachwissen der sachkundig besetzten Prüfgremien blieben außer Betracht. Damit verkenne das Vordergericht die Bedeutung der Statistik und die Möglichkeiten und Grenzen statistischer Verfahren bei der Durchführung der Wirtschaftlichkeitsprüfung. Ob der geprüfte Arzt unwirtschaftlich behandelt habe, sei von den Prüforganen zwar unter Zuhilfenahme statistischer Daten, aber letztlich nach medizinisch-ärztlichen Gesichtspunkten zu entscheiden. Daher komme es auf die Erfüllung der vom SG geforderten statistischen Kriterien nicht entscheidend an.
Die Beklagte und die Beigeladenen zu 1) und 2) beantragen,
das Urteil des Sozialgerichts Stuttgart vom 1. September 1993 aufzuheben und die Klage abzuweisen.
Die Kläger beantragen,
die Revisionen zurückzuweisen.
Entscheidungsgründe
II
Die Revisionen der Beklagten und der Beigeladenen zu 1) sind insofern begründet, als das angefochtene Urteil aufgehoben und die Sache an die Tatsacheninstanz zurückverwiesen werden muß. Die bisher getroffenen Feststellungen reichen für eine abschließende Entscheidung nicht aus.
Ohne weitere Prüfung abzuweisen ist die Klage allerdings, soweit sie sich (auch) gegen den Bescheid der Prüfungskommission richtet. Denn Gegenstand der von den Klägern erhobenen Anfechtungsklage kann entgegen der Auffassung des SG zulässigerweise allein der Bescheid der beklagten Beschwerdekommission sein. Eine gerichtliche Anfechtung der im Verfahren der Wirtschaftlichkeitsprüfung von der Prüfungskommission erlassenen Bescheide scheidet – von bestimmten, hier nicht in Betracht kommenden Ausnahmen abgesehen – aus Rechtsgründen aus; eine darauf gerichtete Klage ist unzulässig (vgl BSGE 72, 214, 219 ff = SozR 3-1300 § 35 Nr 5; BSGE 74, 59 = SozR 3-2500 § 106 Nr 22, jeweils mwN).
Soweit sich die Kläger gegen den Bescheid der beklagten Beschwerdekommission wenden, liegen die Prozeßvoraussetzungen vor.
Die Beklagte ist auch nach der Neufassung des SGB V durch das Gesundheitsstrukturgesetz (GSG) vom 21. Dezember 1992 (BGBl I S 2266) in dem anhängigen Rechtsstreit passiv legitimiert. Zwar hat das GSG die bisherige Aufteilung der ambulanten Versorgung in einen kassen- und einen vertragsärztlichen Bereich mit Wirkung vom 1. Januar 1993 beseitigt und die Wirtschaftlichkeitsprüfung für alle Kassenarten gemeinsamen Prüfungs- und Beschwerdeausschüssen übertragen (§ 106 Abs 4 SGB V idF des GSG). Die Kassenärztliche Bundesvereinigung und die Ersatzkassenverbände haben jedoch durch Vereinbarung vom 29. Januar 1993 (Deutsches Ärzteblatt 1993, C-438) eine Übergangsregelung dahingehend getroffen, daß die Prüfung der Behandlungs- und Verordnungsweise der Vertragsärzte und ärztlich geleiteten Einrichtungen im Ersatzkassenbereich für die Abrechnungsquartale bis einschließlich IV/1992 weiterhin nach den bis zum 31. Dezember 1992 gültigen gewesenen vertraglichen Bestimmungen durch die nach diesen Bestimmungen zuständigen Prüfungseinrichtungen (Prüfungs- und Beschwerdekommissionen) erfolgt. Der Senat hat eine derartige Übergangsregelung für die Prüfung zurückliegender Quartale bereits anläßlich der voraufgegangenen Neuordnung des Prüfwesens im Ersatzkassenbereich durch das Gesundheitsreformgesetz (GRG) vom 20. Dezember 1988 (BGBl I S 2477) als zulässig angesehen (BSGE 67, 41, 43 = SozR 3-2500 § 106 Nr 2 S 4). Er hält sie aus den seinerzeit angeführten Gründen auch im Zusammenhang mit den nunmehr durch das GSG eingeführten Änderungen für statthaft.
In der Sache kann das vorinstanzliche Urteil keinen Bestand haben. Die Auffassung, der angefochtene Kürzungsbescheid sei rechtswidrig, weil die von den Prüfgremien angewandte statistische Methode „Relative Abweichung vom Fachgruppendurchschnitt” für eine Prüfung der Wirtschaftlichkeit der Behandlungsweise generell ungeeignet sei, ist rechtlich nicht haltbar. Das SG verkennt den Begriff der Wirtschaftlichkeitsprüfung nach Durchschnittswerten und den Stellenwert, der statistischen Verfahren und Ergebnissen bei der Wirtschaftlichkeitsprüfung zukommt.
Gemäß § 106 Abs 2 Satz 1 Nr 1 iVm Abs 7 SGB V in der hier noch maßgebenden Fassung des GRG vom 20. Dezember 1988 (BGBl I S 2477) wird die Wirtschaftlichkeit der vertragsärztlichen Versorgung durch eine arztbezogene Prüfung ärztlicher und ärztlich verordneter Leistungen nach Durchschnittswerten geprüft. Mit dieser Regelung hat der Gesetzgeber die in der Praxis der Prüfgremien entwickelte und durch die Rechtsprechung bestätigte Methode des statistischen Kostenvergleichs als Anknüpfungspunkt für die Beurteilung der Wirtschaftlichkeit der ärztlichen Tätigkeit anerkannt und als Regelprüfmethode übernommen (vgl die Begründung des Gesetzentwurfs zum GRG, BT-Drucks 11/2237, S 196 zu § 114). Die dazu unter der Geltung des früheren Rechtszustandes vom BSG entwickelten Grundsätze haben somit auch für das geltende Recht weiterhin Bedeutung (vgl BSGE 69, 138, 141 = SozR 3-2500 § 106 Nr 6 S 24; BSGE 71, 194, 195 = SozR 3-2500 § 106 Nr 15 S 87).
Die Prüfung nach Durchschnittswerten erfolgt im Wege einer Gegenüberstellung der durchschnittlichen Fallkosten des geprüften Arztes einerseits und der Gruppe vergleichbarer Ärzte andererseits. Maßstab für die Beurteilung der Wirtschaftlichkeit ist somit der durchschnittliche Behandlungsaufwand der Ärzte der Vergleichsgruppe in dem zu prüfenden Quartal. Eine Unwirtschaftlichkeit ist anzunehmen, wenn der Fallwert des geprüften Arztes so erheblich über dem Vergleichsgruppendurchschnitt liegt, daß sich die Mehrkosten nicht mehr durch Unterschiede in der Praxisstruktur und den Behandlungsnotwendigkeiten erklären lassen und deshalb zuverlässig auf eine unwirtschaftliche Behandlungsweise als Ursache der erhöhten Aufwendungen geschlossen werden kann. Wann dieser mit dem Begriff des offensichtlichen Mißverhältnisses gekennzeichnete Überschreitungsgrad erreicht ist, hängt von den Besonderheiten des jeweiligen Prüfungsgegenstandes und den Umständen des konkreten Falles ab und entzieht sich einer allgemein verbindlichen Festlegung. Mit der Rechtsansicht des SG, der Grenzwert für das offensichtliche Mißverhältnis müsse auf der Grundlage einer vorgegebenen Grenzwahrscheinlichkeit nach rein mathematisch-statistischen Kriterien bestimmt werden, hat sich der Senat bereits im Urteil vom 9. März 1993 (BSGE 74, 70 = SozR 3-2500 § 106 Nr 23) auseinandergesetzt und dargelegt, daß eine solche Vorgehensweise weder den gesetzlichen Vorgaben noch den Erfordernissen einer effizienten Wirtschaftlichkeitsprüfung gerecht wird. Hieran ist festzuhalten.
Bestrebungen, die Wirtschaftlichkeitsprüfung auf eine rein statistische Operation zu reduzieren und den Prüfungsorganen die Anwendung bestimmter, nach den Maßstäben der statistischen Wissenschaft geeigneter Vergleichsverfahren vorzuschreiben, finden schon im Gesetzeswortlaut selbst keine Stütze, denn § 106 Abs 2 Satz 1 Nr 1 SGB V spricht nicht von einer „statistischen Vergleichsprüfung”, sondern allgemein von einer „arztbezogenen Prüfung nach Durchschnittswerten”. Eine Verkürzung der Wirtschaftlichkeitsprüfung auf eine ausschließlich statistische Untersuchung ist aber vor allem der Eigenart des Prüfungsgegenstandes nicht angemessen. Ob die zur Abrechnung kommenden ärztlichen und ärztlich verordneten Leistungen notwendig und wirtschaftlich waren, kann letztlich nur nach medizinisch-ärztlichen Gesichtspunkten beurteilt werden. Der Aussagewert statistischer Untersuchungen ist in dieser Hinsicht begrenzt. Sie können lediglich Informationen darüber liefern, an welcher Stelle der Bandbreite ärztlichen Behandlungsumfangs die Tätigkeit des geprüften Arztes nach der Zahl der von ihm erbrachten Leistungen einzuordnen ist. Die wesentlichen Kriterien, wie das Behandlungsverhalten und die unterschiedlichen Behandlungsweisen innerhalb der Arztgruppe sowie die bei dem geprüften Arzt vorhandenen Praxisbesonderheiten, denen für die Beurteilung der Wirtschaftlichkeit der Behandlungsweise das entscheidende Gewicht zukommt, werden bei der statistischen Betrachtung nur teilweise oder gar nicht berücksichtigt. Darauf hat auch der vom SG gehörte Sachverständige ausdrücklich hingewiesen (Gliederungspunkt 29 des beigezogenen Gutachtens). Die Rechtsprechung hat deshalb wiederholt betont, daß die Prüfung nach Durchschnittswerten zwar auf einem statistischen Kostenvergleich aufbaut, die statistische Betrachtung aber nur einen Teil der Wirtschaftlichkeitsprüfung ausmacht und durch eine intellektuelle Prüfung und Entscheidung ergänzt werden muß, bei der die für die Frage der Wirtschaftlichkeit relevanten medizinisch-ärztlichen Gesichtspunkte in Rechnung zu stellen sind (zuletzt BSGE 74, 70, 72 = SozR 3-2500 § 106 Nr 23 S 125).
Das Gesetz hat der dargestellten Bedeutung der Berücksichtigung medizinisch-ärztlicher Gesichtspunkte bei der Wirtschaftlichkeitsprüfung dadurch Ausdruck verliehen, daß es diese Prüfung besonderen, von den Partnern der gemeinsamen Selbstverwaltung der Ärzte und Krankenkassen zu bildenden Prüfungs- und Beschwerdeausschüssen übertragen und für diese eine sachkundige Besetzung mit Vertretern der Ärzte und Krankenkassen vorgeschrieben hat (§ 106 Abs 4 Satz 2 SGB V). Hätten die Prüfgremien ausschließlich Ergebnisse statistischer Untersuchungen nachzuvollziehen, hätte es einer derartigen sachkundigen Besetzung nicht bedurft.
Kommt danach den statistischen Erkenntnissen im Rahmen der Wirtschaftlichkeitsprüfung nicht die ihnen von der Vorinstanz beigemessene ausschlaggebende Bedeutung zu, so kann auch die Auffassung nicht geteilt werden, daß die Methode „Relative Abweichung vom Fachgruppendurchschnitt” für die Überprüfung der Wirtschaftlichkeit von Einzelleistungen generell ungeeignet sei. Der vom SG gehörte Sachverständige geht insoweit von unzutreffenden Annahmen aus, wenn er voraussetzt, es würden im Rahmen einer solchen Prüfung schematisch alle Einzelleistungen, bei denen der Fachgruppendurchschnitt erheblich überschritten wird, einer Prüfung und ggf Kürzung unterzogen. Tatsächlich geschieht dies nur bei fachgruppentypischen Leistungen, die nach Einschätzung der Mitglieder der Prüfungsorgane bei Berücksichtigung des Behandlungsverhaltens innerhalb der Fachgruppe und der Praxisumstände des geprüften Arztes wegen der Häufigkeit ihres Ansatzes als auffällig im Sinne einer zu vermutenden Unwirtschaftlichkeit bewertet werden. Das führt in der Prüfpraxis dazu, daß Einzelpositionen trotz massiver Überschreitung der Durchschnittswerte unbeanstandet bleiben, weil die Prüfgremien von vornherein erkennen, daß entweder die Vergleichsgrundlagen nicht ausreichen oder eine Behandlungseigenart vorliegt, die als solche nicht unwirtschaftlich ist. Handelt es sich bei der auffälligen Gebührenposition beispielsweise um eine indikationsgebundene Leistung, die nicht beliebig austauschbar oder ersetzbar ist, so können aus einer deutlich überhöhten Ansatzhäufigkeit durchaus rechtliche Schlußfolgerungen gezogen werden, auch wenn dies bei einer rein statistischen Betrachtung nicht möglich wäre. Eine Überschreitung des Fachgruppendurchschnitts kann in einem solchen Fall nicht, wie das SG im Zusammenhang mit der Forderung nach Festlegung einer Grenzwahrscheinlichkeit formuliert, „auf reinem Zufall” beruhen, sondern hat stets eine in den Praxisumständen oder der Behandlungsweise des Arztes begründete Ursache, die sich jedenfalls dann, wenn der Mehraufwand eine erhebliche Größenordnung erreicht, durch eine genauere Untersuchung, ggf unter Mitwirkung des betroffenen Arztes, auch feststellen läßt. Bestehen im Einzelfall gleichwohl Zweifel, ob die Abweichung hinreichend signifikant ist, kann oftmals durch eine Betrachtung des längerfristigen Behandlungsverhaltens über mehrere Abrechnungsquartale genauerer Aufschluß gewonnen werden. Daß die statistischen Abweichungen nicht für sich genommen zur Grundlage der Beurteilung gemacht, sondern in der vorgenannten Weise einer intellektuellen Bewertung unterzogen werden, läßt der Sachverständige bei seiner vom SG übernommenen Forderung nach einer Fehlerkorrektur für multiples Testen außer acht.
Auf der Grundlage der von der Vorinstanz getroffenen Feststellungen kann der Senat über die Berechtigung der Honorarkürzungen nicht abschließende entscheiden. Aus den Prüfbescheiden und dem angefochtenen Urteil ergibt sich, daß die Leistung nach Nr 825 E-GO von ca drei Vierteln und die Leistung nach Nr 851 E-GO von etwas mehr als der Hälfte der Fachgruppenangehörigen zur Abrechnung gebracht wird und von den ausführenden Ärzten – über eine größere Zahl von Quartalen gleichbleibend – durchschnittlich fünf- bis sechsmal auf 100 Behandlungsfälle angesetzt wurde. Daraus kann entnommen werden, daß es sich um fachgruppentypische Leistungen handelt, bei denen eine Prüfung nach Durchschnittswerten hinreichend aussagekräftige Ergebnisse erwarten läßt. Die Prüfgremien haben weiter festgestellt, daß die Kläger den Fachgruppendurchschnitt nicht nur bei den beanstandeten Gebührenpositionen, sondern auch bei der zugehörigen Leistungssparte (um 2,2 Standardabweichungen), den Gesamtleistungen (um 2,1 Standardabweichungen) und den Arzneiverordnungskosten (um ca 10 %) überschritten haben, so daß für einen Ausgleich des Mehraufwandes durch einen Minderaufwand in anderen Bereichen kein Anhalt besteht. Der Anwendungsbereich der Leistungen nach Nrn 825 und 851 E-GO ist durch Indikationsvorgaben begrenzt; beide Leistungen sind nur berechnungsfähig, wenn psychische bzw psychosomatische Krankheiten behandelt werden. Bei dieser Sachlage wäre die Einschätzung der Prüforgane, daß bei einer im Vergleich zum Fachgruppendurchschnitt doppelt so hohen Ansatzhäufigkeit die Grenze zum offensichtlichen Mißverhältnis erreicht ist, nur dann nicht vertretbar, wenn ein überdurchschnittlich hoher Anteil an psychisch kranken Patienten eine erheblich erhöhte Frequenz der in Rede stehenden Leistungen rechtfertigen würde.
Die Kläger haben im Verwaltungsverfahren offenbar Praxisbesonderheiten in dieser Richtung behauptet; die Prüfgremien haben solche Besonderheiten verneint. Beide haben für ihre jeweiligen Standpunkte auf Ausführungen in früheren Prüfverfahren Bezug genommen, deren Inhalt nicht bekannt und dem Urteil des SG nicht zu entnehmen ist. Da das Revisionsgericht hierzu selbst keine Feststellungen treffen kann, muß die weitere Klärung durch das Tatsachengericht erfolgen. Der Senat hat dabei von der durch § 170 Abs 4 Satz 1 des Sozialgerichtsgesetzes eröffneten Möglichkeit gebraucht gemacht, die Sache an das zuständige Landessozialgericht zurückzuverweisen. Dieses wird auch über die Kosten des Revisionsverfahrens zu befinden haben.
Fundstellen