Verfahrensgang
Tenor
Auf die Revision des Klägers werden die Urteile des Landessozialgerichts Niedersachsen vom 21. März 1990 und des Sozialgerichts Hannover vom 27. Juli 1988 sowie der Bescheid der Beklagten vom 20. Mai 1985 aufgehoben.
Die Beklagte wird verpflichtet, über die Widersprüche des Klägers gegen die Bescheide der Prüfungskommission vom 6. Juni 1984 und 13. September 1984 erneut unter Beachtung der Rechtsauffassung des Senats zu entscheiden.
Die Beklagte hat dem Kläger dessen außergerichtlichen Kosten des Rechtsstreits zu erstatten. Im übrigen sind außergerichtliche Kosten nicht zu erstatten.
Tatbestand
I
Der Kläger, ein seit Oktober 1982 an der kassen- und vertragsärztlichen Versorgung teilnehmender Arzt für Frauenheilkunde und Geburtshilfe, wendet sich gegen die Kürzung seiner Ersatzkassenhonorare für das erste und zweite Quartal 1984.
Nach den Feststellungen der Prüfungsgremien überschritt er in den genannten Quartalen den Fallkostendurchschnitt seiner Fachgruppe bei den Gesamtleistungen um 32 vH (54,21 DM zu 41,05 DM) bzw 30 vH (52,87 DM zu 40,77 DM). Bei der Gruppe der Sonderleistungen beliefen sich die Überschreitungen auf jeweils 56 vH (33,23 DM zu 21,31 DM bzw 32,71 DM zu 20,91 DM). Die Prüfungskommission kürzte wegen unwirtschaftlicher Behandlungsweise die Honoraranforderungen für Sonderleistungen im Quartal I/84 um 15% und im Quartal II/84 um 10%. Die Beschwerdekommission ermäßigte den Umfang der Kürzung im Quartal I/84 auf 10% und wies im übrigen den Widerspruch des Klägers zurück. Im Widerspruchsbescheid vom 20. Mai 1985 führte sie aus, die Überschreitungen bei den Sonderleistungen lägen im Bereich des offensichtlichen Mißverhältnisses. Zwar wiesen die Honorarwerte der Gynäkologen in dieser Leistungssparte insgesamt eine große Schwankungsbreite auf, was sich in einer hohen Standardabweichung von über 50% des Mittelwertes niederschlage. Doch bestehe diese starke Streuung nur deshalb, weil vier der insgesamt 47 Ärzte der Fachgruppe in großer Zahl ambulante Operationen durchführten und dadurch ein erheblich vom Gruppendurchschnitt abweichendes Leistungsspektrum aufwiesen. Nehme man die Abrechnungen dieser vier Ärzte aus der Vergleichsbetrachtung heraus, so sinke die Standardabweichung auf unter 35% des Mittelwertes. Den bereinigten Gruppendurchschnitt überschreite der Kläger im Quartal I/84 um 77 vH und im Quartal II/84 um 74 vH. Der Mehraufwand bei den Sonderleistungen resultiere im wesentlichen aus einer überproportional häufigen Abrechnung der Leistungspositionen 65 (eingehende, das gewöhnliche Maß übersteigende Untersuchung) und 1075 (vaginale Behandlung) der Ersatzkassen-Gebührenordnung (E-GO), für die es keine plausible Begründung gebe.
Die Klage ist in den Vorinstanzen ohne Erfolg geblieben (Urteil des Sozialgerichts ≪SG≫ Hannover vom 27. Juli 1988; Urteil des Landessozialgerichts ≪LSG≫ Niedersachsen vom 21. März 1990). Das LSG hat die Handhabung der statistischen Vergleichsmethode durch die Beklagte und die aus der Ergebnissen des Fallkostenvergleichs gezogenen Schlußfolgerungen gebilligt. Gegen die von der Beschwerdekommission vorgenommene Modifizierung der Vergleichsgruppe durch Herausnahme von vier Ärzten mit abweichendem Leistungsspektrum bestünden allerdings Bedenken. Doch handele es sich dabei nur um Hilfserwägungen, die für die Entscheidung nicht tragend gewesen seien. Orientierten sich die Prüfgremien an arithmetischen Durchschnittswerten, so könne es im allgemeinen nicht beanstandet werden, wenn sie die Grenze zum offentlichtlichen Mißverhältnis bei einer Fallwertüberschreitung um 50% ansetzten. Praxisbesonderheiten und Einsparungen in anderen Leistungsbereichen, mit denen der Kläger den Mehraufwand zu rechtfertigen versuche, habe die Beklagte zu Recht nicht anerkannt.
Mit seiner vom Senat zugelassenen Revision rügt der Kläger die Verletzung materiellrechtlicher Grundsätze der Wirtschaftlichkeitsprüfung. Werde der statistische Fallkostenvergleich nicht auf die Gesamtleistungen, sondern nur auf eine bestimmte Leistungssparte erstreckt, so könne ein offensichtliches Mißverhältnis nicht schon bei einer Überschreitung des Fachgruppendurchschnitts um 50 vH angenommen werden. Mindestens müsse nach der Rechtsprechung des Bundessozialgerichts (BSG) in solchen Fällen eine Heraufsetzung des Grenzwertes von den Prüfungseinrichtungen in Erwägung gezogen werden. Das gelte erst recht, wenn die geprüfte Leistungsgruppe wie vorliegend eine auffallend starke Streuung der Kostendurchschnitte aufweise und damit der Aussagewert des arithmetischen Mittels als Ausdruck wirtschaftlicher Behandlung gemindert sei. Hiermit habe sich die Beklagte in keiner Weise argumentativ auseinandergesetzt. Nachdem in seinem Fall die Überschreitung bei den Sonderleistungen nicht einmal 60 vH erreiche, könne von einem Anscheinsbeweis der Unwirtschaftlichkeit keine Rede sein.
Der Kläger beantragt sinngemäß,
das Urteil des Landessozialgerichts Niedersachsen vom 21. März 1990 und das Urteil des Sozialgerichts Hannover vom 27. Juli 1988 sowie den Bescheid der Beklagten vom 20. Mai 1985 aufzuheben und die Beklagte zu verpflichten, über die Widersprüche des Klägers gegen die Bescheide der Prüfungskommission vom 6. Juni 1984 und 13. September 1984 unter Beachtung der Rechtsauffassung des Gerichts erneut zu entscheiden.
Die Beklagte und der Beigeladene beantragen,
die Revision zurückzuweisen.
Sie halten das angefochtene Urteil für zutreffend.
Entscheidungsgründe
II
Der Senat hat über die Revision in der Besetzung mit zwei Kassenärzten als ehrenamtlichen Richtern entschieden, weil Streitigkeiten, welche die Wirtschaftlichkeitsprüfung im Ersatzkassenbereich für Quartale vor dem 1. Januar 1989 betreffen, den „Angelegenheiten der Kassenärzte” iS von § 12 Abs 3 Satz 2 Sozialgerichtsgesetz (SGG) zuzuordnen sind (vgl dazu im einzelnen das zur Veröffentlichung bestimmte Urteil vom heutigen Tage in der Sache 6 RKa 27/90).
Die Revision des Klägers hat Erfolg. Die Kürzung der Honorare für Sonderleistungen läßt sich mit der von der Beschwerdekommission gegebenen Begründung nicht halten.
Maßgebend für die rechtliche Beurteilung sind hier noch die Vorschriften des früheren, bis 30. September 1990 in Kraft gewesenen Arzt/Ersatzkassenvertrages (EKV aF). Nach dessen § 1 Nr 5 muß die ärztliche Versorgung der Ersatzkassenpatienten ausreichend und zweckmäßig sein, darf aber das Maß des Notwendigen nicht überschreiten. Jeder Vertragsarzt hat bei seiner Tätigkeit dieses Maß des Notwendigen zu beachten und hierauf seine Behandlungsweise einzustellen (§ 2 Nr 2 EKV aF). Hat ein Vertragsarzt gegen das so bestimmte Wirtschaftlichkeitsgebot verstoßen, ist die Beklagte als – nach altem Vertragsrecht noch zuständige – Prüfungsinstanz berechtigt, bei der Festsetzung des vom Vertragsarzt geltend gemachten Honoraranspruchs Abstriche vorzunehmen (§ 14 Nr 1 EKV aF). Sofern über die streitbefangenen Quartale bereits Honorarabrechnungsbescheide erteilt worden sind, dürfen die Prüfungsinstanzen diese – ggf teilweise – aufheben, ohne an die Voraussetzungen der §§ 44 ff des Zehnten Buches des Sozialgesetzbuchs (SGB X) gebunden zu sein (s BSG SozR 3-2500 § 85 Nr 2 mwN).
Keine Einwände bestehen dagegen, daß die Prüfungsinstanzen die ihnen aufgetragene Wirtschaftlichkeitsprüfung auf der Grundlage eines statistischen Kostenvergleichs durchgeführt und auf eine Begutachtung der einzelnen Behandlungsfälle verzichtet haben. Bei der statistischen Methode werden die durchschnittlichen Kosten des geprüften Arztes den durchschnittlichen Fallkosten der Gruppe vergleichbarer Ärzte gegenübergestellt. Liegt der Fallwert des geprüften Arztes so erheblich über dem Vergleichsgruppendurchschnitt, daß zwischen beiden ein offensichtliches Mißverhältnis besteht, so ist daraus auf die Unwirtschaftlichkeit der Behandlungstätigkeit zu schließen, es sei denn, es ließe sich feststellen, daß Besonderheiten der jeweiligen Praxis den Mehraufwand ganz oder teilweise rechtfertigen oder daß der Mehraufwand für einen Minderaufwand in anderen Leistungsbereichen ursächlich gewesen ist (BSG SozR 2200 § 368n Nr 39 S 126, Nr 43 S 144).
Der Begriff des offensichtlichen Mißverhältnisses beschreibt den Grad an statistischer Abweichung, bei dem sich die Mehrkosten regelmäßig nicht mehr durch Unterschiede in der Praxisstruktur und den Behandlungsnotwendigkeiten erklären lassen und bei dem deshalb zuverlässig auf eine unwirtschaftliche Behandlungsweise als Ursache der erhöhten Aufwendungen geschlossen werden kann. Ab welchem Überschreitungsprozentsatz diese Voraussetzung erfüllt ist, läßt sich wegen der unterschiedlichen Struktur und Homogenität der verschiedenen Vergleichskollektive nicht für alle Fälle einheitlich beantworten. Der Senat hat deshalb den fachkundig besetzen Prüfungseinrichtungen insoweit einen gewissen Beurteilungsspielraum zugebilligt und Grenzziehungen bei einer Fallwertüberschreitung um 50% (vgl BSG SozR 2200 § 368n Nr 31) bzw um einen Wert zwischen 40 und 60% (vgl BSGE 62, 24, 30 = SozR 2200 § 368n Nr 48) als vertretbar angesehen. Das LSG, das sich auf diese Rechtsprechung beruft, übersieht indessen, daß sich die Aussagen in den genannten Urteilen auf einen Gesamtleistungsvergleich beziehen und nicht unbesehen auf Fälle übertragen werden können, in denen nur die Werte einer bestimmten Leistungssparte oder gar nur Ansätze bestimmter Leistungspositionen miteinander verglichen werden. Eine derartige, auf Teilbereiche der ärztlichen Tätigkeit beschränkte Gegenüberstellung von Fallkosten kann die Wirtschaftlichkeitsprüfung verbessern, indem sie einen genaueren Aufschluß über das Behandlungsverhalten im einzelnen gibt. Sie birgt aber auch Gefahren. Da sich die unterschiedlichen Diagnose- und Behandlungsmethoden der Ärzte in den einzelnen Leistungssparten naturgemäß stärker auswirken als beim Gesamtfallwert, ist der Aussagewert eines Sparten- oder Einzelleistungsvergleichs tendenziell geringer und die Gefahr einer Fehlinterpretation größer als bei einem Gesamtvergleich (zur statistischen Problematik bei der Überprüfung einzelner Leistungsgruppen und Gebührennummern vgl Gaus, Prüfung der Wirtschaftlichkeit der Behandlungs- und Verordnungsweise des Kassenarztes, 1988, Kapitel 8, S 31 ff). Dementsprechend hat der Senat bereits im Urteil vom 2. Juni 1987 (BSGE 62, 24, 30 = SozR 2200 § 368n Nr 48 S 162) zum Ausdruck gebracht, daß es naheliegt, bei einem Vergleich von Leistungssparten und Leistungsarten auch höhere Grenzwerte in Betracht zu ziehen.
Das muß freilich nicht bedeuten, daß den Prüfgremien ein bestimmter höherer Grenzwert zwingend vorgeschrieben wird, zumal von Fall zu Fall auch bei Leistungsgruppen und sogar bei Einzelleistungen eine sehr homogene Kostenverteilung mit nur geringer Streuung vorliegen kann, die es rechtfertigt, schon bei einer Überschreitung des Vergleichsgruppendurchschnitts von 50% oder weniger ein offensichtliches Mißverhältnis anzunehmen. Die mit einem Sparten- oder Einzelleistungsvergleich verbundenen statistischen Risiken nötigen aber dazu, die Festlegung nicht schematisch vorzunehmen, sondern sich zuvor Rechenschaft über die Strukturen und das tatsächliche Behandlungsverhalten innerhalb des speziellen, engeren Leistungsbereichs zu geben, um die Eignung der Vergleichsgruppe und den Aussagewert der gefundenen Vergleichszahlen beurteilen zu können. Ob dazu stets die für die Ermittlung der Streuungsverhältnisse innerhalb der Gruppe notwendigen statistischen Kenndaten (Standardabweichung und Variabilitäts-Koeffizient) angegeben werden müssen, braucht hier nicht entschieden zu werden. Der Senat hat dies bei einem Gesamtleistungsvergleich verneint und darauf hingewiesen, daß zum einen auch die Streuungsverhältnisse nur bedingt etwas über die Bandbreite wirtschaftlichen Verhaltens innerhalb einer Arztgruppe aussagen und zum anderen die – nach den Kriterien des ärztlichen Berufsrechts gebildete – Fachgruppe in der Regel als Vergleichskollektiv hinreichend homogen ist, um auch mit Hilfe einer auf die bloße Gegenüberstellung arithmetischer Durchschnittswerte beschränkten Vergleichsprüfung beweiskräftige Aussagen über die Wirtschaftlichkeit der ärztlichen Behandlungsweise gewinnen zu können (BSGE 62, 24, 27 = SozR 2200 § 368n Nr 48 S 157). Diese Überlegungen lassen sich aus den dargelegten Gründen auf die statistische Prüfung von einzelnen Leistungsbereichen nicht ohne weiteres übertragen. Da dort für die Grenzziehung zum offensichtlichen Mißverhältnis nicht – wie in der Regel bei einem Gesamtleistungsvergleich – auf gesicherte Erfahrungswerte zurückgegriffen werden kann, bedarf es einer genaueren Untersuchung der Vergleichsgrundlagen, um entscheiden zu können, ob die statistischen Abweichungen unter Berücksichtigung der Besonderheiten des jeweiligen Prüfungsgegenstandes ein Ausmaß erreichen, das den Schluß auf eine Unwirtschaftlichkeit der Behandlungsweise rechtfertigt. Welcher Erkenntnisse sich die Prüfungseinrichtungen dazu bedienen wollen, bleibt ihnen überlassen. Die maßgebenden Gesichtspunkte müssen aber im Bescheid genannt werden, damit festgestellt werden kann, ob der Verwaltungsentscheidung ein ausreichend ermittelter und für die Beweisführung geeigneter Sachverhalt zugrunde liegt.
Der Forderung nach einer genaueren Überprüfung der statistischen Grundlagen bei der Durchführung von Sparten- oder Einzelleistungsvergleichen kann nicht mit dem Argument begegnet werden, etwaige Fehler oder Ungenauigkeiten bei der statistischen Vergleichsprüfung ließen sich in den weiteren, an den statistischen Vergleich anschließenden Prüfungsabschnitten korrigieren, in denen auch Besonderheiten der geprüften Arztpraxis und anderen, von der Statistik nicht erfaßten medizinisch-ärztlichen Gesichtspunkten nachgegangen werden könne (so allerdings noch BSGE 62, 24, 28 = SozR 2200 § 368n Nr 48 S 158 für den Fall eines Gesamtvergleichs). Der Kläger weist mit Recht darauf hin, daß der Feststellung eines offensichtlichen Mißverhältnisses nach der Rechtsprechung des BSG praktisch die Wirkung eines Anscheinsbeweises mit der Folge zukommt, daß damit eine Verschlechterung der Beweisposition des geprüften Arztes verbunden ist. Die auf das Ergebnis des Kostenvergleichs gegründete Vermutung der Unwirtschaftlichkeit kann zwar dadurch ausgeräumt werden, daß Umstände aufgezeigt werden, die eine andere als die sich nach den Zahlenverhältnissen aufdrängende Verursachung ernsthaft als möglich erscheinen lassen und damit die aufgrund der statistischen Wahrscheinlichkeitsaussage gewonnene Überzeugung im konkreten Fall erschüttern. Dazu genügt es aber nicht, daß der Arzt die Tatsachen, aus denen sich der atypische Verlauf ergeben soll, lediglich behauptet; diese Tatsachen müssen vielmehr bewiesen werden. Gelingt es den zur Amtsermittlung verpflichteten Prüfungsinstanzen und Gerichten trotz Ausschöpfung der zur Verfügung stehenden Erkenntnisquellen nicht, den Beweis zu erbringen, so geht dies zu Lasten des Arztes. Er hat nach dem Grundsatz der objektiven Beweislast den Nachteil zu tragen, wenn sich nicht feststellen läßt, daß seine Praxis Besonderheiten aufweist, die geeignet sind, den durch das offensichtliche Mißverhältnis prima facie erbrachten Beweis der Unwirtschaftlichkeit in Zweifel zu ziehen (BSG SozR 2200 § 368n Nr 43 S 146 mwN). Den statistischen Erkenntnissen kommt danach für den weiteren Verlauf der Prüfung eine so entscheidende Bedeutung zu, daß ihr Aussagewert nicht im Dunkeln bleiben darf.
Im vorliegenden Fall hat die Beklagte von sich aus die für die Beurteilung der Streuungsverhältnisse und damit der Homogenität der Vergleichsgruppe geeigneten Kenndaten erhoben und in den Kürzungsbescheiden dokumentiert. Danach hat der Kläger zwar bei isolierter Betrachtung der arithmetischen Durchschnittswerte in der Sparte der Sonderleistungen den Fallwert seiner Fachgruppe in beiden streitbefangenen Quartalen um jeweils 56% überschritten. Bezogen auf das für diese spezielle Leistungssparte ermittelte Streuungsmaß erreichen die Überschreitungen aber nur eine Größenordnung von 1,11 bzw 1,26 Standardabweichungen. Hält man sich vor Augen, daß bei einer Normalverteilung innerhalb des Bereichs einer Standardabweichung nur ca 68% der gefundenen Werte liegen und daß für das Auftreten von Mehrkosten in der vorgenannten Größenordnung eine Zufallswahrscheinlichkeit von mehr als 10% besteht (vgl dazu Gaus, aaO, S 90 Tabelle 3), berücksichtigt man ferner, daß die seit 1. Oktober 1990 für den Ersatzkassenbereich geltende Prüfvereinbarung eine Honorarabrechnung überhaupt erst dann als statistisch auffällig bewertet, wenn bei einer Leistungssparte der Fallwert der Vergleichsgruppe um mehr als 200% der mittleren Abweichung (= 2,0 Standardabweichungen) überschritten wird, so zeigt dies, daß die festgestellten statistischen Überschreitungen allein zum Beweis der Unwirtschaftlichkeit nicht ausreichen können.
Davon ist offenkundig auch die Beschwerdekommission ausgegangen, denn sie hat im Widerspruchsbescheid die unzureichende Homogenität der Vergleichsgruppe eingeräumt und versucht, den Vorwurf der Unwirtschaftlichkeit durch zusätzliche Feststellungen zu erhärten. Solche Bemühungen können freilich nur dann zu rechtlich tragbaren Ergebnissen führen, wenn sich die angestellten Erwägungen in die gewählte Prüfmethode und deren Gesetzmäßigkeiten einfügen (vgl dazu bereits BSGE 55, 110, 111 = SozR 2200 § 368n Nr 27 S 81). Der Hinweis, der erhöhte Fallwert des Klägers bei den Sonderleistungen beruhe auf einer überdurchschnittlich häufigen Abrechnung der Leistungen nach Nrn 65 und 1075 E-GO, sagt zwar etwas über die Ursache des Mehraufwandes aus, beweist aber nicht dessen Unwirtschaftlichkeit. Da die Beklagte den naheliegenden Weg, die statistische Vergleichsprüfung auf die beiden genannten Leistungen zu beschränken, nicht gegangen ist, ergeben sich aus der vorgenannten Feststellung keine weiterführenden Erkenntnisse. Anders verhält es sich mit dem Versuch, den Einwänden des Klägers durch eine ergänzende Vergleichsbetrachtung unter Zugrundelegung einer engeren, homogeneren Vergleichsgruppe zu begegnen. Das ist entgegen der Auffassung der Revision ein im Grundsatz zulässiger und geeigneter Weg, den Aussagewert des statistischen Vergleichs zu erhöhen und genauere Anhaltspunkte für die Beurteilung der Wirtschaftlichkeit der Behandlungsweise des geprüften Arztes zu gewinnen. Allerdings liegt auf der Hand, daß die Veränderung des Vergleichskollektivs nicht darin bestehen kann, daß einzelne Ärzte mit hohen Kostendurchschnitten aus der Statistik herausgenommen werden, um auf diese Weise den Fachgruppendurchschnitt zu senken. Eine Aufteilung der Fachgruppe in Untergruppen ist aber dann unbedenklich und sinnvoll, wenn dadurch Ärzte mit untereinander übereinstimmendem, aber gegenüber der anderen Gruppe wesentliche verschiedenem Leistungsspektrum zusammengefaßt werden. Unter der Voraussetzung, daß die neue, engere Vergleichsgruppe weiterhin eine für die statistische Vergleichsbetrachtung hinreichend große Zahl an Ärzten umfaßt, kann mit Hilfe dieser Methode die Vergleichsbasis so weit verbessert werden, daß verläßliche Aussagen zur Wirtschaftlichkeit der ärztlichen Tätigkeit möglich sind. Diesen Weg ist die Beklagte mit Recht gegangen und dabei zu eindeutigen Ergebnissen gelangt.
Wenn der angefochtene Widerspruchsbescheid dennoch aufgehoben werden muß, so deshalb, weil die Angaben zur Vergleichsgruppenbildung für eine gerichtliche Überprüfung nicht ausreichen. Die Beschwerdekommission hat lediglich ausgeführt, daß die vier Gynäkologen, die für die starke Streuung bei den Sonderleistungen verantwortlich sind, in großem Umfang ambulante Operationen ausführen. Daraus allein läßt sich nicht ersehen, ob sich die Behandlungstätigkeit dieser Ärzte tatsächlich so erheblich von derjenigen aller übrigen im Bezirk der Beklagten zugelassenen Frauenärzte unterscheidet, daß dies ihre Herausnahme aus der Vergleichsgruppe rechtfertigt. Es fehlen Angaben dazu, welchen Anteil die operativen Leistungen an ihren Gesamtleistungen ausmachen, ferner, ob sie die einzigen Ärzte innerhalb der Fachgruppe sind, die ambulant operieren, oder ob und in welchem Umfang auch andere Fachgruppenmitglieder operativ tätig sind, ob also letztlich eine klare Trennung zwischen operativ tätigen und sonstigen Gynäkologen überhaupt möglich ist. Auch sagt der Bescheid nichts darüber aus, inwieweit es gerade die Operationsleistungen sind, die die hohen Fallwerte der genannten vier Ärzte bei der Gruppe der Sonderleistungen verursacht haben. Ohne diesbezügliche Feststellungen läßt sich nicht entscheiden, ob die modifizierte Vergleichsgruppe sachgerecht abgegrenzt worden ist oder nicht. Die Beklagte wird bei der erneuten Entscheidung die fehlenden Angaben nachzutragen haben. Sollte sich dabei die Zulässigkeit der vorgenommenen Vergleichsgruppenbildung erweisen, so sind die ausgesprochenen Kürzungen nicht zu beanstanden.
Die Kostenentscheidung beruht auf § 193 SGG.
Fundstellen